La historia del desarrollo de los motores de búsqueda. Motores de búsqueda rusos que aparecieron el motor de búsqueda antes

Los motores de búsqueda (PS) ya son decentes, es una parte obligatoria de Internet. Hoy en día son mecanismos enormes y más complicados que no solo son una herramienta para encontrar información necesaria, sino también áreas bastante emocionantes para los negocios.


Muchos usuarios de búsqueda nunca han pensado en los principios de su trabajo, sobre cómo manejar las solicitudes de usuario, cómo se construyen y funcionan los datos del sistema. Este material ayudará a las personas que se dedican a la optimización y, entenderán el dispositivo y las funciones básicas de los motores de búsqueda.

Funciones y concepto PS

Sistema de búsqueda - Este es un hardware y un paquete de software que pretende implementar la función de búsqueda de Internet y responder a una consulta de usuario que generalmente se especifica como una frase de texto (o una consulta de búsqueda más precisa), emitiendo una lista de referencia a las fuentes de información realizadas por Relevancia. Los sistemas de búsqueda más comunes y grandes: Google, Bing, Yahoo, Baidu. En Runet - Yandex, Mail.ru, Rambler.

Considere con más detalle el valor de la consulta de búsqueda en sí, tomando el sistema Yandex, por ejemplo.

La solicitud debe ser formulada por el usuario en plena cumplimiento con el tema de su búsqueda, lo más simple posible y brevemente. Por ejemplo, deseamos encontrar información en este motor de búsqueda: "Cómo elegir un automóvil por sí mismo". Para hacer esto, abra la página principal e ingrese una solicitud para buscar "Cómo elegir un automóvil". Luego, nuestras funciones se reducen para ingresar los enlaces a fuentes de información proporcionadas en la red.




Pero incluso actuando de esta manera, puede y no obtener la información que necesita. Si obtuvimos un resultado negativo similar, solo necesita reformar su solicitud, o en la base de datos de búsqueda, realmente no hay información útil sobre este tipo de solicitud (es muy posible en los parámetros de consulta "estrechos" especificados, como, por ejemplo, , "Cómo elegir un coche en Anadri").

La tarea más básica de cada motor de búsqueda es entregar a las personas exactamente el tipo de información que necesitan. Y para comprometer a los usuarios para crear un tipo de solicitudes de "correcto" para los motores de búsqueda, es decir, frases que corresponderán a sus principios de trabajo, prácticamente imposibles.

Es por eso que los especialistas en el desarrollo de motores de búsqueda hacen tales principios y algoritmos de su trabajo que le darían a los usuarios a encontrar su información. Esto significa que el sistema debe "pensar" al igual que una persona piensa al encontrar la información necesaria en Internet.

Cuando ingresa su solicitud al motor de búsqueda, desea encontrar lo que necesita, lo más fácil posible y más rápido. Habiendo recibido el resultado, el usuario representa su evaluación del sistema, guiado por varios criterios. ¿Llegó a encontrar la información necesaria? Si no, ¿cuántas veces tuvo que reformar el texto de la consulta para encontrarlo? ¿Qué información relevante se obtuvieron? ¿Qué tan rápido se ha procesado el motor de búsqueda su solicitud? ¿Qué tan cómodos fueron los resultados de la búsqueda? ¿Fue el resultado necesario primero, o se encontró en un lugar 30? ¿Cuántos "basura" (información innecesaria) se encontró con información útil? ¿Habrá una información relevante para ello, al usar PS, en una semana, o en un mes?




Para obtener las respuestas correctas a tales preguntas, los desarrolladores de búsqueda están mejorando constantemente los principios de ranking y sus algoritmos, agregue nuevas oportunidades y funciones y cualquier medio para que el sistema funcione más rápido.

Las principales características de los motores de búsqueda.

Denote las características principales de la búsqueda:

Plenitud.

La plenitud es una de las características de búsqueda más importantes, es la proporción de los números que se encuentran a petición de documentos de información a su número total en Internet relacionado con esta solicitud. Por ejemplo, hay 100 páginas con la frase "Cómo elegir un automóvil" y, en la misma consulta, solo quedaban 60 en total, entonces, en este caso, la búsqueda llena de 0.6 es 0.6. Está claro que cuanto mayor sea la búsqueda en sí, mayor será la probabilidad de que el usuario encuentre exactamente el documento que necesita, por supuesto, si existe en absoluto.

Precisión.

Otra función básica del motor de búsqueda es la precisión. Determina el grado de cumplimiento de la solicitud del usuario de las páginas encontradas en la red. Por ejemplo, si la frase clave "Cómo elegir un automóvil" hay cien documentos, en la mitad de ellos contienen esta frase, y en el resto, simplemente tiene tales palabras (cómo elegir una radio automovilística e instalarla en el Coche "), luego la precisión de búsqueda igual a 50/100 \u003d 0.5.

De lo que la búsqueda es más precisa, más pronto, el usuario encontrará la información que necesita, la "basura" menos diversa se reunirá entre los resultados, menos documentos encontrarán no corresponder al significado de la solicitud.

Relevancia.

Este es un componente importante de la búsqueda, que caracteriza el tiempo que pasa desde el momento de la publicación de información en Internet hasta que se publique en la base de índice de motores de búsqueda.

Por ejemplo, al día siguiente, después de la información sobre la versión del nuevo iPad, muchos usuarios se dirigieron a la búsqueda con los tipos de solicitudes correspondientes. En la mayoría de los casos, la información sobre esta noticia ya está disponible en la búsqueda, aunque muy poco ha pasado desde su apariencia. Esto se debe a la presencia de "base rápida" de los grandes motores de búsqueda, que se actualiza varias veces al día.

Velocidad de búsqueda.

Esta función, ya que la velocidad de búsqueda está estrechamente relacionada con la llamada "estabilidad de las cargas". Cada segunda búsqueda es dibujada por una gran cantidad de personas, una carga de trabajo requiere una reducción significativa en el tiempo para manejar una solicitud. Aquí, los intereses tanto del motor de búsqueda como del usuario coinciden: el visitante desea obtener resultados lo más rápido posible, y el motor de búsqueda debe resolverlo lo más rápido posible, para no ralentizar el procesamiento de solicitudes posteriores.

Visualidad.

Una representación visual de los resultados es un elemento esencial de la conveniencia de búsqueda. Según una multitud de solicitudes, el motor de búsqueda encuentra miles, y en algunos casos millones de documentos diferentes. Debido a la borrosidad de la compilación de frases clave para la búsqueda o su no exactitud, incluso los primeros resultados de la consulta no siempre tienen solo la información necesaria.

Esto significa que una persona a menudo tiene su propia búsqueda entre los resultados proporcionados. Una variedad de componentes de las páginas emisoras de PS ayudan a navegar en los resultados de búsqueda.

La historia del desarrollo de los motores de búsqueda.

Cuando Internet comenzó a desarrollarse, el número de sus usuarios regulares era pequeño, y la cantidad de información para el acceso era relativamente pequeña. En su mayoría, el acceso a esta red tenía solo especialistas en áreas de investigación. En ese momento, la tarea de encontrar información no fue tan relevante como ahora.

Uno de los primeros métodos de organización de un amplio acceso a los recursos de información fue la creación de catálogos del sitio, y las referencias a ellos comenzaron a agruparse sobre los temas. Así que el primer proyecto fue el recurso Yahoo.com, que se inauguró en la primavera de 1994. Posteriormente, cuando el número de sitios en el directorio de Yahoo aumentó significativamente, se agregó la opción de encontrar la información necesaria en el catálogo. Todavía no ha sido completamente un motor de búsqueda, ya que el área de dicha búsqueda se limitó solo por sitios incluidos en este directorio, y no todos los recursos en Internet. Los catálogos de enlaces fueron bastante utilizados anteriormente, pero en la actualidad, casi perdieron completamente su popularidad.

Después de todo, incluso hoy en día, enormes catálogos tienen información sobre un poco a parte de los sitios web en Internet. El catálogo más famoso y grande del mundo tiene información sobre cinco millones de sitios cuando Google Base contiene información sobre más de 25 mil millones de páginas.




El primer motor de búsqueda real fue Webcrawler, que surgió en el año 1994.

El próximo año, apareció Altavista y Lycos. Además, el primero fue el líder en la búsqueda de información durante mucho tiempo.




En 1997, Sergey Brin, junto con Larry Page, creó un motor de búsqueda de Google como un proyecto de investigación en la Universidad de Standford. Hoy, Google, el motor de búsqueda más popular y popular del mundo.




En septiembre de 1997, Yandex fue anunciado (oficialmente), que actualmente es el sistema de búsqueda más popular en Runet.




Según N. Septiembre de 2015.La proporción de motores de búsqueda en el mundo se distribuye de la siguiente manera:
  • Google - 69.24%;
  • Bing - 12.26%;
  • Yahoo! - 9.19%;
  • Baidu - 6.48%;
  • AOL - 1.11%;
  • PREGUNTE - 0.23%;
  • Excite - 0.00%


Según N. diciembre de 2016., Signos de motores de búsqueda en Runet:

  • Yandex - 48.40%
  • Google - 45.10%
  • Buscar.mail.ru - 5.70%
  • Rambler - 0.40%
  • Bing - 0.30%
  • Yahoo - 0.10%

Principios del motor de búsqueda

En Rusia, el sistema de búsqueda principal es Yandex, luego Google, y luego [email protected]. Todos los sistemas de búsqueda grandes tienen su propia estructura, que es muy diferente de los demás. Pero aún puede seleccionar los elementos principales comunes a todos los motores de búsqueda.

Módulo de indexación.

Este componente consta de tres programas de robot:

Araña. (en inglés. Spider) - un programa que está destinado a descargar páginas web. "Spider" descarga una determinada página, al mismo tiempo, eliminando todos los enlaces de él. El código HTML se descarga con casi todas las páginas. Para esto, los robots utilizan protocolos HTTP.




"Spider" funciona de la siguiente manera. El robot transmite una solicitud al servidor "Obtener / ruta / documento" y otros comandos de consulta HTTP. En respuesta, el programa de robots recibe un flujo de texto que contiene la información del tipo de servicio y, por supuesto, el documento en sí.
  • URL de la página descargada;
  • fecha en que se descarga la página;
  • encabezado de servidor de respuesta HTTP;
  • código HTML, páginas "Cuerpo".
Tractor. ("Viajar" araña). Este programa ingresa automáticamente todos los enlaces que se encuentran en la página, y también los resaltan. Su tarea es decidir dónde se encuentre en el futuro, se debe encontrar la araña, en función de estos enlaces o en función de la lista especificada de direcciones.

Indexador (Robot indexer) es un programa que analiza las páginas que las arañas descargadas.



El indexador desmonta completamente la página a los elementos compuestos y analiza su análisis, aplicando sus tipos morfológicos y léxicos de algoritmos.

El análisis se realiza durante varias partes de la página, como titulares, texto, enlaces, características estilísticas y estructurales, etiquetas HTML, etc.

Por lo tanto, el módulo de indexación permite someterse a las referencias del número específico de recursos, descargar páginas, extraer la masa de referencia a las nuevas páginas de los documentos recibidos y hacer su análisis detallado.

Base de datos

Base de datos (o el índice de motores de búsqueda) es un conjunto de almacenamiento de datos, una serie de información en la que se almacenan los parámetros ajustados de cada índice procesado y documento descargado.

Servidor de búsqueda.

Este es el elemento más importante de todo el sistema, porque la velocidad y, por supuesto, la calidad de la búsqueda depende de los algoritmos subyacentes a su funcionalidad.

El servidor de búsqueda funciona de la siguiente manera:

  • La solicitud que proviene del usuario está sujeta al análisis morfológico. Se genera el entorno de información de cualquier documento disponible en la base de datos (continuará mostrándose como un fragmento, es decir, el campo de información de texto de la solicitud correspondiente).
  • Los datos obtenidos transmiten como los parámetros de entrada con un módulo de clasificación especializado. Se procesan en todos los documentos, y al final, para cada documento, se calcula su calificación, lo que caracteriza la relevancia de un documento de este tipo como una solicitud de usuario, y otros componentes.
  • Dependiendo de las condiciones del usuario especificado por el usuario, esta clasificación puede ser ajustada por otros.
  • Luego se genera por el fragmento de fragmento, es decir,. Para cualquier documento encontrado en la tabla correspondiente, el título, la anotación que más se encuentra con la consulta, y el enlace a este documento, mientras que las formas y palabras de palabras encontradas se resaltan.
  • Los resultados de la búsqueda recibida se transmiten a la persona en forma de página de una página que se emiten resultados de búsqueda (SERP).
Todos estos elementos están estrechamente relacionados entre sí y funcionan, interactúan, formando un mecanismo distinto, pero bastante difícil para el funcionamiento de la PS, que requiere enormes costos de los recursos.

1. Introducción

La optimización del sitio generalmente incluye la conversión de la estructura del sitio, llenando con contenido textual, dependiendo de las solicitudes promovidas, así como varias formas de aumentar la cita del recurso. Además de los procesos de optimización estándar, existen numerosos métodos que ya se aplican a un motor de búsqueda específico. Por supuesto, los motores de búsqueda con códigos abiertos son raros, y los optimizadores tienen algo que romper la cabeza, pero algunos patrones básicos de comportamiento se pueden rastrear en sistemas ya asequibles.

En esta clase de maestría, consideraremos los motores de búsqueda extranjeros más populares y los motores de búsqueda en Rusia con una tinta de análisis comparativo.

2. Motores de búsqueda rusos

Google, Yandex y Rambler de hoy se consideran los motores de búsqueda más populares en Rusia. El sistema Yandex es más visitado y tiene un problema relevante en la extensión necesaria, por lo tanto, la mayoría de las veces se toman optimizantes para promover el recurso en este sistema.

Considere con más detalle cada uno de estos motores de búsqueda.

Google

Google tiene su propio análogo ruso, menos popular que el estadounidense original, pero no es inferior a la calidad de la búsqueda. Google en Rusia tiene numerosos fanáticos que creen que este motor de búsqueda da el mejor resultado.

PageRank utilizado en Google se basa principalmente en la popularidad de los enlaces. Esos. Al calcular la relevancia de la página, la mayor contribución tiene la cantidad y la calidad de los enlaces a las páginas de otras páginas.

En este momento, la base de datos de Google tiene más de mil millones de páginas indexadas.

Google es uno de los pocos motores de búsqueda que indexan profundamente su sitio. Google utiliza la popularidad de los enlaces como el factor más importante para determinar la relevancia de la página. Por lo tanto, los sitios grandes y populares sean más fáciles de ingresar en posiciones altas en los resultados de búsqueda. También protege a Google de SPAM.

Google cree que los siguientes factores serán los más pesados \u200b\u200bcuando se clasifican las páginas:

  • Popularidad de enlace (índice de citas);
  • Palabra clave proximidad y densidad (densidad y frecuencia de palabras clave);
  • Palabras clave en el texto del enlace (palabras clave en enlaces);
  • Enfatizar el texto (texto seleccionado).
Yandex

Una característica distintiva de Yandex es una búsqueda intuitiva en todas las formas de flujo. Desarrollo único bajo la lengua rusa particular.

El catálogo de Yandex usa tal cosa como Índice Temático de Citas (TIC) . Está determinado por el número y la calidad de los enlaces externos a su sitio. La calidad del enlace afecta al TIC del recurso que se refiere a usted. Un papel importante es desempeñado por la proximidad temática de su sitio al referirse a sus recursos.

Al contar el índice de citas, no se tienen en cuenta los enlaces de foros, juntas web, conferencias, sitios ubicados en los alojamientos libres (si no se describen en el catálogo de Yandex). Naturalmente, los enlaces de esos sitios que Yandex no indexan (por ejemplo, los sitios extranjeros) no se tienen en cuenta.

El número de hosts depende de los visitantes (que más que más, más hosts), y el Índice de Citas Yandex, de los autores de los Sitios (más autores colocan un enlace a su recurso, mayor será el valor de CY).

El valor del índice de citas está determinado por la relevancia del recurso en el directorio de Yandex y, en consecuencia, la posición de su sitio en la sección seleccionada.

La reindexación del documento lleva aproximadamente dos semanas cada vez, pero para cada sitio, el robot se ajusta por separado. Todo depende de la frecuencia de actualización. Según yandex, etiqueta< meta name="Revizit-after" content="n-days"> Ningún papel en el trabajo del robot no juega.

Yandex indexa a la red rusa, por lo que los servidores se ingresan en el motor de búsqueda en su, ru, am, az, por, GE, KG, KZ, MD, UA, Domains UZ. Los servidores restantes se ingresan solo si han encontrado texto en ruso.

Información en el título (etiqueta< title >) YANDEX muestra en los resultados de búsqueda. Palabras en la etiqueta< title >, Tener un peso mayor que todos los demás. Palabras clave en la etiqueta< meta> También aumente el peso de la palabra en el documento, pero solo si la palabra en sí está en la página.

Además de los métodos anteriores, la frecuencia de su uso en los titulares afecta la relevancia de la palabra (< h1>, < h2> ...), en el atributo alt, en puntas emergentes (etiqueta< acronym>) y el porcentaje de la ocurrencia de esta palabra en el documento, es decir, ¿Con qué frecuencia lo usas? Pero al mismo tiempo es necesario guardar el significado del documento, de lo contrario, Yandex puede contar esta palabra spam.

Excursionista.

Él es el mejor rúbrico de hoy. Es conveniente porque todos los recursos se dividen en secciones, subsecciones, etc. Muchos de ellos participan en la calificación TOP100, que le permite determinar la popularidad de uno u otro recurso.

Se cree que el factor fundamental para promover el sitio en Rambler es un buen contenido y asistencia, medido utilizando el medidor instalado en el sitio. Por lo tanto, las posiciones altas en el ranking pueden ocupar el sitio bien promovido, cualitativamente y ha demostrado durante mucho tiempo en Internet, con una gran asistencia.

Aport

El menos popular de los motores de búsqueda enumerados. Los principales criterios que este sistema tiene en cuenta los sitios al clasificar sitios:

  • el número de palabras deseadas en el texto del documento (como porcentaje), la distancia entre las palabras de búsqueda en el texto del documento;
  • coloque en el texto donde se encuentran las palabras de búsqueda (título, descripción, meta, etc.);
  • la apariencia de la fuente, que se califican en el texto de las palabras soviéticas (tamaño, grasas, color);
  • el número de enlaces de Internet a este documento;
  • usando la palabra deseada en el texto de los enlaces desde Internet a este documento.

3. Motores de búsqueda extranjera

Los motores de búsqueda extranjeros presentados a continuación son ampliamente conocidos y utilizados en todo el mundo. Para los webmasters, estos motores de búsqueda son los lugares más importantes para registrarse, ya que potencialmente pueden llevar a un gran número de visitantes al sitio. Algunos de los sistemas enumerados no son motores de búsqueda completos, sino que solo usan los recursos de otros motores de búsqueda conocidos.

Es considerado por el número de páginas indexadas de uno de los motores de búsqueda más grandes. El sistema ha ganado gran popularidad gracias a la capacidad de buscar criterios de selección complicados. AltaVista ofrece servicios adicionales en la búsqueda de directorios de Open Directory, LookSmart, pregunte Jeeves.

Google es un motor de búsqueda que utiliza el número de enlaces a un sitio web como el parámetro principal de la popularidad del sitio. Esto es especialmente útil cuando busca buenos sitios que usan consultas de búsqueda simples. Google es famoso por una alta relevancia de referencia. Google tiene una base de datos muy grande de sitios indexados y proporciona parte de sus resultados en Yahoo y Netscape.

Yahoo es las instalaciones de búsqueda más populares y más antiguas. En Yahoo, hay alrededor de 150 editores que conforman y editan los contenidos de sus directorios. Yahoo tiene más de 1 millón de sitios indexados en la base de datos. Además, en el caso de una escasez de su propia base de datos, Yahoo usa la base de datos de Google, y antes, debo decir, usé la base Inktomi.

Hit directo mide el número de clics. Sitios para los cuales más click, obtienen la mejor calificación. Conocido llamado "Popularidad de los motores de búsqueda".

Los resultados del golpe directo también aparecen en HOTBOT, así como, en forma de opción, se pueden mostrar en la búsqueda de MSN.

Los resultados del sistema se toman de la mirada, Inktomi, RealNames y HIT directo. Para los usuarios de búsqueda, hay una oportunidad única para guardar los resultados de la búsqueda anterior.

La brillante diferencia del sistema es que se venden las posiciones en la extradición. GOTO considera que tal emisión es más relevante. También puedes comprar lugares más altos en varias calificaciones. Los resultados no pagados proporcionan inktomi.

Este sistema no implementa la posibilidad de ingresar a una palabra de búsqueda directamente, solo a través de la interfaz de otros motores de búsqueda. Y un gran conjunto.

Una característica característica se puede llamar excelentes resultados para cada uno de sus socios de esta base. La variación de los resultados proporciona la capacidad de emitir un motor de búsqueda separado para diferir de otros.

El llenado de este sistema se llevó a cabo con la participación de los voluntarios. Después de la formación suficiente, se hizo posible usar libremente sus resultados. Actualmente, Open Directory usa Lycos, AOL Búsqueda, Altavista y Honebot.

Una característica distintiva de este sistema es que al escribir una palabra clave (por ejemplo, una marca de empresa), puede llegar al sitio web oficial de esta empresa.

4. Características de la promoción.

Cualquiera que sea el motor de búsqueda, el ruso o el extranjero, cualquiera que tenga los algoritmos de filtración, siga siendo el criterio principal para evaluar la relevancia del recurso en relación con una consulta específica es la presencia de relleno textual de alta calidad, que no puede, sino que no puede regociarse. Para los optimizadores de conciencia, la tarea primitiva al promover un recurso, en primer lugar, optimizando el contenido del sitio, su navegación de referencia interna y su comodidad para un usuario directo, y no la optimización directa en un motor de búsqueda específico.

El segundo paso más grande al promover en muchos motores de búsqueda es la presencia de un número máximo de referencias al recurso. Aunque entre muchos usuarios directos, existe una opinión de que este criterio no puede proporcionar plenamente el resultado, hoy es necesario.

Se puede decir que otras características de la promoción para diferentes motores de búsqueda, que, francamente, ya no están "limpios", están formados directamente por los costos de los algoritmos de filtrado de los motores de búsqueda. Por lo tanto, los motores de búsqueda provocan optimizadores para ir a trucos. Esto es especialmente cierto en los principales motores de búsqueda rusos, caracterizados por la tendencia a monopolizar.

5. Conclusión

La clase magistral nos permite evaluar las diferencias fundamentales en los gigantes de búsqueda y hacer una idea de la información más o menos relevante en Internet. La presencia de numerosos motores de búsqueda crea una competencia significativa y, como saben, la competencia implica los procesos dirigidos al progreso y el desarrollo en la dirección correcta. En este caso, la principal prioridad sigue siendo un resultado cualitativo. ¡Hurra!


A principios de la década de 1990, los usuarios de Internet no tenían hábito para hacer preguntas a los motores de búsqueda. Referencias a sitios útiles, que se enteran principalmente de conocidos, recopilados en archivos de texto separados. Más tarde, los sitios: catálogos con el encabezado, que se reponen manualmente. Tal, por ejemplo, fueron sitios yahoo! y la Biblioteca Virtual (VLIB), que llevó y mantuvo al inventor del moderno Internet Tim Berners-Lee en el servidor CERN.

El primero en la historia del motor de búsqueda, un Archie apareció en 1990, un archivo de archivos con catálogos de sitios descargados y la búsqueda de ellos, creada por estudiantes de la Universidad de McGill en Montreal. Archie no indexó el contenido de los sitios: esto se aprendió por los motores de búsqueda que se ejecutan en 1993, entre los cuales se encontraban en World Wirl Wanderer, AliWeb y Sumpstation. Este último se convirtió en el primer motor de búsqueda de pleno derecho en un sentido moderno: recopila y clasificó las referencias en la extradición de la solicitud del usuario.

Los creadores de los primeros motores de búsqueda.
en el bulto o tirar esta ocupaciónya sea cambiado al trabajo
en grandes empresas en línea

AltaVista apareció en 1994 se convirtió en el primer motor de búsqueda que funcionó con solicitudes de lenguaje natural, y el primer motor de búsqueda realmente poderoso fue Webcrawler, que indexa completamente los contenidos de las páginas. Finalmente, en 1997-1998, Google y Yandex ganaron, los motores de búsqueda más populares en Rusia para hoy. Gracias a los mejores algoritmos, se han convertido en un líder internacional y regional, respectivamente, pero para seleccionar una participación de otros participantes del mercado, necesitaban tiempo. Los creadores de los primeros motores de búsqueda en la masa principal o arrojaron esta ocupación, o se mudaron a trabajar en grandes compañías de Internet que las compraron en todo el sistema.

Internet tiene un sitio web especial en el que el usuario en una consulta dada puede obtener enlaces a sitios que cumplan con esta solicitud. El motor de búsqueda consta de tres componentes: 1 Robot de búsqueda; 2 índice del sistema; y 3 programas, ... ... Vocabulario financiero

Subs., Cal en Sinonisims: 3 Fortika (9) Ircka (16) Motor de búsqueda (13) Diccionario de sinónimos como ... Diccionario Eur

sistema de búsqueda - Sitio de motores de búsqueda, con el que se buscan otros sitios. La búsqueda se realiza ingresando palabras clave en el cuadro de búsqueda. A diferencia de los directorios, incluso si el sitio no se registró anteriormente, se puede encontrar con un motor de búsqueda. ... ... Directorio Técnico Traductor

sistema de búsqueda - IEŠKOS SISTEMA STATASS T Sritity Automatika Atitikmenys: Angl. Buscando el sistema VOK. Suchstist, n rus. Motor de búsqueda, F Panc. Système de Recherche, M ... Automatikos Terminų Žodynas

Sistema de búsqueda - - - (English Buscar Engine, sinónimos: buscador, búsqueda del servidor, motor de búsqueda) - Herramienta para buscar información en Internet. Como regla general, la búsqueda del motor de búsqueda consta de dos etapas. Programa Especial (Búsqueda Robot, Automático, Agente, ... ... Diccionario enciclopédico de los medios de comunicación.

Control, sistema de control automático (consulte el control automático), en el que la exposición de control por parte del método de búsqueda cambia automáticamente t. O. es el mejor objeto de control (en el sentido); Con ... ... Gran Enciclopedia Soviética

Sistema de control automático Administrativo, en la acción de control de enjambres, el método de búsqueda de cambios automáticos T. O. Para llevar a cabo el mejor control del objeto; Al mismo tiempo, el carácter cambia al objeto o los impactos externamente. Miércoles de antelación ... Gran enciclopédico diccionario politécnico

SMP 1 está redactificando para buscar rescatadores que han caído en condiciones críticas asociadas con la amenaza a la vida, así como la búsqueda de bienes parathedral y varios objetos en la mala visibilidad. Consiste en: la búsqueda de radio de búsqueda está activa ... ... Diccionario situaciones rápidas

sistema de recuperación de información automatizada. - 3.2.5 Motor de búsqueda de información automatizada: IPS, implementado sobre la base de la fuente de equipos de computación electrónica ... Diccionario Directorio Términos de Documentación Regulatoria y Técnica.

Este término también tiene otros significados, vea aport. Aport ... Wikipedia

Libros

  • Tareas extremas de la teoría de los gráficos e Internet. Tutorial, Railgorodsky Andrei Mikhailovich. Se dedica un folleto real al estudio de varias tareas extremas de la teoría de los gráficos, (al menos parciales) cuya solución puede ser útil al analizar los datos. Se originó sobre la base de ...
  • Tareas extremas de la teoría de los gráficos e Internet, RAILGORODSKY FM .. Este folleto está dedicado al estudio de varias tareas extremas de la teoría de los gráficos, (al menos parciales) cuya solución puede ser útil al analizar los datos. Se originó sobre la base de ...

La historia del desarrollo de la Internet rusa (Runet) está realizando oficialmente una cuenta regresiva desde 1994. Fue entonces cuando se registró el dominio Zone.RU, y comenzaron a aparecer los primeros sitios, muchos de los cuales se levantaron posteriormente en portales populares.

Biblioteca Moshkova, RosbizonsontSalting Agencia de noticias, Estudio Artemia Lebebedev: todos estos recursos fueron fundados a mediados de los 90 del siglo pasado.

¿Cómo aparecen los primeros motores de búsqueda?

Durante bastante tiempo, la "población" de Runet se limitó a una pequeña cantidad de estos pioneros de las tecnologías de la red. Eran tan poco que los conceptos de "búsqueda" en ese momento simplemente no existían.

La mayoría de los sitios necesarios podrían guardarse en los marcadores del navegador, y para el resto hubo directorios, donde todos los enlaces se agruparon en varias categorías principales. El primer catálogo de este tipo fue la Rusia en la red (http://www.ru), un poco más tarde, Dmoz, Yahoo y Yandex.Catalog aparecieron un poco más tarde.

Sin embargo, a lo largo del tiempo, el número de usuarios de Internet aumentó, la cantidad de sitios creados para que estos usuarios también podrían visitarlos y recibir la información que necesitan.

Gradualmente, la base de datos de directorios creció tanto que era muy difícil encontrar algo manualmente. Luego, la idea apareció para automatizar el proceso de búsqueda y crear un servicio interactivo especializado para esto.

La demanda siempre da lugar a una oración, por lo que en Internet, los proyectos de búsqueda de diferentes autores comenzaron a aparecer en Internet. Algunos de ellos, como Webcrawler, Lycos, Infoseeek y otros no lograron un éxito serio y, después de un tiempo, han trabajado en la oscuridad en los espacios infinitos de la World Wide Web.

Pero para otras compañías más exitosas, todo lo desarrollado es mucho mejor, los principales desarrolladores modernos de los motores de búsqueda se formaron durante este período y durante los últimos años lograron lograr resultados impresionantes.

Que es un motor de búsqueda

El motor de búsqueda moderno es un mecanismo complejo que requiere enormes recursos (tanto humanos como materiales) para apoyar el trabajo actual y el desarrollo sostenible.

En el corazón de la búsqueda de la emisión de búsqueda se encuentra la fórmula de clasificación notoria, que tiene en cuenta cientos de diversos factores, a partir del dispositivo interno del sitio y los textos de sus páginas y finalizan con referencias externas, el atractivo de las propuestas comerciales publicadas. en el recurso, y las características del comportamiento de los usuarios que lo cambiaron de la búsqueda.

En 2006-2007, los representantes de Yandex declararon que para descifrar su algoritmo necesitaba todo un instituto de investigación, porque su búsqueda se basaba en más de 800 factores diferentes. Desde entonces, han pasado años, la fórmula de clasificación se ha vuelto más complicada por varios órdenes de magnitud, y los factores que tienen el mayor impacto en los resultados de la emisión se han vuelto prácticamente imposibles de influir en los factores.

Por lo tanto, detrás de la simplicidad externa de la página principal y la rápida reacción de Yandex o Google a la frase de búsqueda introducida por usted, el trabajo minucioso de miles de personas y enormes inversiones financieras en infraestructura, equipos y recursos humanos están ocultos.

Al mismo tiempo, es obvio que los líderes hoy en día aseguraron tal superioridad sobre aquellos que quieren hacerles al menos alguna competencia de que el precio del boleto de entrada a este mercado se mide por miles de millones de dólares.

Una confirmación de tal estado de cosas puede ser la historia de los intentos de penetrar en el motor de búsqueda en la famosa y la compañía de software más rica de Microsoft. Su motor de búsqueda Bing durante más de diez años posicionó como un competidor serio de los jugadores líderes, para los cuales se invirtieron enormes fondos.

Y en los últimos años, estas inversiones han comenzado a dar los primeros resultados, aunque pueden ser satisfactorios satisfactorios para ser llamados solo con una exageración muy grande: la proporción de Bing en el mercado ruso en el momento de escribir el artículo fue menor que uno por ciento.

Otro ejemplo, conclusiones bien ilustrativas hechas antes, motor de búsqueda de Nigma ruso. Sus creadores eligieron una estrategia de marketing de nicho. Aparentemente, se entiende claramente que, en el campo abierto de la búsqueda general, la competencia de los polos del mercado es casi imposible, los desarrolladores del algoritmo fueron en el camino de proporcionar los servicios de búsqueda en estructuras educativas en el campo de la química, matemáticas. , física y otras ciencias.

Sin embargo, la audiencia objetivo de dicho proyecto es, obviamente, algunos, que definitivamente se reflejan en su asistencia: según el medidor de LiveInternet, el número de usuarios de este sistema es solo un décimo por ciento.

  1. El líder de calificación incondicional es Yandex. Según el mismo medidor, Yandex tiene una "participación de control" en el mercado de motores de búsqueda: en julio de 2014, la fracción del motor de búsqueda fue más del 52%.
  2. En segundo lugar, Google se solucionó con confianza: 38%.
  3. El tercer lugar con un margen bastante grande ocupa el Portal de Mail.Ru. Hace algún tiempo, el sitio popular, aparentemente, estaba comprometido en la búsqueda de un hermano mayor, lo que puede ser más caro: el motor de Yandex y Google se integraron alternativamente en su área de juegos de búsqueda. Pero desde 2013, la compañía ha tomado un curso sobre desarrollo independiente, y ahora el sitio ha sido implementado por el algoritmo de búsqueda de su propio desarrollo. Es cierto que no afectó la proporción del sistema del sistema, que, aparentemente, se determina principalmente por la promoción de la marca y el atractivo de los servicios presentados en el sitio. En los últimos años, la asistencia del servicio go.mail.ru fluctúa alrededor de la marca del 7%.

Todos los demás motores de búsqueda, incluido el rambler que una vez, se pueden considerar, excepto como fondo natural, todos no tienen un impacto significativo en la distribución de los asientos en la parte superior de los motores de búsqueda, siendo en el nivel de 0.1-0.7 por ciento del mercado. .

Análisis del mercado de búsqueda en línea ruso.

El mercado de motores de búsqueda en Rusia es muy específico. Para su descripción, puede usar dos características: concentradas y débilmente competitivas. De hecho, la proporción de tres jugadores principales supera el 97%, lo que indica su ventaja abrumadora sobre todos los demás.

La posición dominante tiene un motor de búsqueda ruso yandex. Como hemos dicho, su participación supera el 50%. En esto, nuestro país es único: solo nosotros, en China y la República Checa, los motores de búsqueda nacionales tienen una competencia tangible al gigante mundial, Google.

Por el número de consultas de búsqueda procesadas, Yandex ocupa el cuarto lugar en el mundo. Al mismo tiempo, si el primer lugar de Google en esta lista difícilmente puede estar sujeto a dudas razonables, entonces el segundo lugar de la Baidu chino es causada por el enorme número de este país. Tercer lugar: Yahoo tiene una doble ventaja en relación con el monopolista ruso.

De acuerdo con las reglas del mercado europeo, Yandex realmente se puede llamar monopolista, tal definición se asigna a cualquier compañía, cuya participación de mercado supera el 35%.

En nuestro país, este estado de cosas se llama dominio y no es punible hasta que se demuestre el beneficio existente. Está claro que en el entorno de Internet, el hecho de los abusos confirmó es muy difícil.

Cómo determinar la proporción del motor de búsqueda en el tráfico total.

Una evaluación objetiva de este indicador es bastante simple. El hecho es que la abrumadora mayoría de los sitios rusos han instalado medidores del operador líder de las estadísticas de Internet de LiveInternet.

Por supuesto, estos contadores no se colocan todos los sitios, además, los siguientes enlaces no se tienen en cuenta las zonas de dominio .su y la Federación de Rusia. Pero aún así, la muestra anterior puede considerarse bastante representativa, tiene en cuenta todos los temas principales, regiones y tipos de sitios disponibles actualmente en Runet.

Entonces, para ver la posición actual de los asuntos por referencia: http: //www.liveinternet.ru/stat/ru/searches.html? Fecha \u003d 2014-07-31; Período \u003d ....

Este es un resumen completo de la cantidad de visitantes que han llegado a los sitios registrados en usuarios rusos para junio y julio de 2014.

Las conclusiones son obvias. Análisis de la posición de las cosas que ya hemos liderado en la sección anterior.

Características de los principales motores de búsqueda de Rusia.

Yandex.

El surgimiento de este motor de búsqueda en el mercado ilustra muy bien la situación en el país en un momento en que comenzó a adquirir los contornos modernos. No es de extrañar que Yandex se llama el espejo de Runet, aparentemente, esta definición se puede ampliar en una realidad objetiva.

El desarrollo de la compañía es muy similar a la evolución de toda la sociedad, por lo que, en cierta medida, el líder nacional es el espejo de todo el país de finales del siglo XX.

Para ilustrar una declaración tan audaz, vamos a activar brevemente a la historia de la empresa y al motor de búsqueda de Yandex.

Los tiempos después de la reestructuración se caracterizan por una seria reevaluación de los valores la parte más activa de la sociedad y el surgimiento de nuevas personas energéticas en la arena política y empresarial, unidas en sus vidas de la idea: modernizar las condiciones para la existencia. de sí mismos y su país para garantizar un estándar digno de vida para todos los que comparten sus creencias.

Una de las córneas de esa época es Arkady Volozh, quien logró unir a los mejores especialistas de trabajo a su alrededor que sentó la base del futuro motor de búsqueda.

Yandex, probablemente, nunca se habría convertido en un espejo de Runet si no hubiera un estilo increíble de Arkady Volodya, quien logró ver la perspectiva principal de la época en la construcción de un motor de búsqueda ruso.

Para implementar su idea, logró redirigir los flujos financieros a este proyecto, formados por transacciones de trueque para el intercambio de Partes importadas en nuestro país a cambio de los escalones de las semillas de calabaza Kuban.

Por supuesto, los grandes proyectos no se hacen sin un equipo de personas afines. Y luego el fundador de Yandex tuvo suerte, logró atraer al físico Ilya Segalovich a su lado del talento y con muchas esperanzas muy altas, con quien estaba familiarizado con el banco de la escuela.

Es difícil decir cuál fue la última paja, apretando para el futuro del Gran Científico, todas las perspectivas de una brillante carrera científica. Puede ser muy bueno que el papel crucial fue desempeñado por la verdadera obsesión y el talento de la condena del Director Permanente de Yandex, pero Ilya se convirtió en el Director Técnico de la Compañía e hizo una contribución invaluable a su desarrollo.


Fue él quien se convirtió en el autor del nombre y el logotipo, que ahora se le conoce a todos los que al menos una vez fueron a Internet. Segalovich se interesó en la idea del análisis morfológico de frases en ruso y la posibilidad de clasificar los textos en función de las reglas para construir estructuras gramaticales.

Como resultado, apareció la expresión "otro índice", "otro índice", que en la versión abreviada con la mano ligera del motor de búsqueda se convirtió en la palabra yandex. En el futuro, para enfatizar el propósito principal del motor de búsqueda, para buscar en el segmento de Internet de habla rusa: el logotipo se transformó en Yandex.

Ilya Segalovich dedicó toda su vida a la formación y desarrollo de este proyecto. Desafortunadamente, en 2013 no se convirtió, pero lo vive, Yandex está aumentando su superioridad sobre los competidores, mejorando constantemente el algoritmo de búsqueda, cuyos fundamentos consideraron su difunto director de tecnología y desarrollo.

Google

El motor de búsqueda de Google se fundó durante un año antes de Yandex, pero en el mercado ruso apareció solo en 2004. Por supuesto, a lo largo de los años, Yandex logró adaptar su búsqueda de los detalles de nuestro país.

A pesar de que una cantidad bastante significativa de los usuarios de Internet a la pregunta, la respuesta a la que no saben se ofrecen a "Google", y no "Preguntar a Yandex", el principal problema del gigante mundial es insuficiente contabilidad de la morfología. De los textos de habla rusa, como resultado de lo cual la respuesta a solicitar a los usuarios a menudo está incompleta o un poco distorsionada.

Puede argumentar durante mucho tiempo, cuya búsqueda es mejor y a partir de qué sistema están más motivados (o clientes "calientes". Pero, como nos parece, la imagen típica para el usuario ruso es la siguiente: primero, se solicita el "espejo de la runet", y si los resultados de su búsqueda no eran relevantes (y así, desafortunadamente, sucede con bastante frecuencia) , la solicitud es reheusaria a Google.


Los descendientes globales de Google ocurren mucho menos a menudo que Yandex. Pero cambian la emisión tan seriamente que muchos sitios autorizados, los que están en la parte superior, están al final de los primeros cientos de resultados emisores.

Entonces, por ejemplo, la última versión del algoritmo "Panda" fue excelente para algunas tiendas líderes en línea, tocadas incluso en Amazon.com aparentemente inviolables y otros.

En 2013, la compañía finalmente dejó de transmitir la búsqueda de otra persona en su área de juegos e implementó su propia opción de motor de búsqueda en go.mail.ru.

Este paso solo puede ser bienvenido, porque en el futuro, el motor de búsqueda de Mail.RU puede tener una resistencia seria al dúo de los líderes, que aún puede relajarse, sin sentir la intención de respiración de los competidores por sus espaldas.

La proporción de este motor de búsqueda ahora no supera el 7%, pero tiene una buena perspectiva de un aumento en el desarrollo de los servicios sociales proporcionados por la empresa: compañeros de clase, mi círculo, correo, etc.

Motores de búsqueda con participación de mercado menos del 1%.

Este grupo se enfoca principalmente en el sistema principal, que no se pudo hacer a la elite de la búsqueda rusa. Entre ellos, la compañía Rambler ocupa una situación especial, una vez ocupada con confianza el segundo lugar y demostrando tendencias muy prometedoras.

Excursionista

Apareciendo en 1996, como la creación de programadores de la ciencia de Pushchino bajo el liderazgo del entusiasta del talentoso Dmitry Kryukov, Rambler inmediatamente se convirtió en el líder del mercado del motor de búsqueda. En aquellos días, Yandex aún no estaba, y Google apenas estaba comenzando su procesión en el territorio de América y en los países cercanos.

Parecería que tal forá debería haber ayudado a "tramp" (y se traduce de manera tan traducida de la palabra rambler inglesa) para obtener ventajas competitivas notables en el desarrollo.

Pero si los conflictos internos en la empresa, ya sea que la falta de una estrategia claramente pronunciada condujo al hecho de que Rambler ahora transmite la búsqueda de Yandex y más conocida como agregadora de algunos servicios populares, incluidos los sitios Rambler Top100.

Bing

Es la búsqueda de MSN, Live Seacrh, Windows Live Seacrh - Producto de Microsoft, luchando desesperadamente por el lugar bajo el Sol en el mercado de motores de búsqueda. Este es uno de los pocos servicios que usan su propio motor.

Los resultados de la búsqueda son bastante aceptables, el principal problema del sitio, aparentemente, es de baja fama entre los usuarios.

Aport

Otro ejemplo del triste destino de una vez uno de los líderes del mercado. Hubo momentos en que este motor de búsqueda se mantuvo firmemente en tercer lugar después de Yandex y Rambler, y en su directorio Webmaster buscó obtener tan activamente como en el catálogo DMOZ o YANDEX.

Ahora el sitio tiene una tienda en línea de artículos populares del hogar. Búsqueda de AIGE Si permanece, está oculto en algún lugar en las profundidades del recurso, en uno de sus subdominios.

Lo que necesitas para escribir tu propio motor de búsqueda.

Para responder a esta pregunta, es necesario imaginarlo bien lo que es el motor de búsqueda y cómo funciona. En parte, ya hemos considerado los principios básicos de construir una fórmula de clasificación de sitios en los resultados de búsqueda. Además, es necesario tener en cuenta los siguientes puntos:

La tarea principal del motor de búsqueda es responder a la solicitud del usuario. La respuesta debe ser clara y relevante, de lo contrario, el usuario irá a otros sistemas, incluso a pesar de la baja competencia en esta industria.

Para dar dicha respuesta, el algoritmo de búsqueda es necesario en el momento de su formación para ver los contenidos de muchas páginas de mil millones en la red en busca de la más adecuada para una solicitud en particular. Para hacer esto, los motores de búsqueda crean sus propias bases de datos que se denominan índices y almacenan toda la información necesaria allí.

El índice está formado constantemente escaneando la red en busca de nuevos sitios que aparecieron, así como los cambios en las páginas ya indexadas. Programas especiales referidos a este trabajo, llamados robots de índice.

Caminan alrededor del reloj en los sitios y leen información actualizada. La organización del trabajo de tales robots requiere la construcción de un gran centro de datos en varias miles de computadoras poderosas con toda infraestructura, desde una potencia y enfriamiento ininterrumpido y terminando con un servicio y modernización regulares.

Los usuarios quieren recibir respuestas rápidas y adecuadas a sus solicitudes. Por lo tanto, el motor de búsqueda moderno debe tener en cuenta no solo las características de los sitios conocidos, sino también preferencias, características de comportamiento y la posición geográfica de cada uno de sus clientes.

Para esto, el algoritmo de búsqueda debe tener elementos de inteligencia artificial y poder estudiar de manera independiente en el proceso de su trabajo. Obviamente, para escribir un motor de este tipo, necesita un gran equipo de programadores de la clase más alta.

Teniendo en cuenta que los motores de búsqueda líderes ya han decidido todos estos problemas y tienen todo el potencial necesario para un mayor desarrollo, el costo de ingresar a este mercado parece estar casi traducido.

Por lo tanto, un nuevo jugador puede aparecer en un futuro próximo en un futuro próximo, capaz de elevar un lugar digno en varios sistemas existentes. Aunque, si esto sucede de repente, todos ganarán, y los motores de búsqueda, los mismos que recibirán nuevos incentivos para una mejora aún mayor, y nosotros, los usuarios comunes caprichosos que siempre carecen de algo y quieren buscar todos los días para ser mejor y mejor.