El gigante Google nos ofrece varios servicios. Conozcamos en esta oportunidad cómo funciona su motor de búsqueda Chrome para rastrear la web y elegir los resultados más adecuados para resolver las consultas de los usuarios.
El buscador de Google es en la actualidad la página de inicio del navegador de millones de usuarios. Este motor nos ayuda a navegar en la red organizando toda la información que hay en ella.
¿CÓMO ORGANIZA GOOGLE LA INFORMACIÓN?
En Internet existen miles o millones de páginas web que contienen información que puede resultar relevante para los usuarios cuando buscan un dato.
Para poder ofrecer estos resultados el algoritmo lleva a cabo un complejo proceso de rastreo, indexación y clasificación.
CÓMO RASTREA GOOGLE LAS PÁGINAS DE INTERNET
El proceso de rastreo empieza con una lista de direcciones web procedente de anteriores rastreos, y por otro con los mapas del sitio que facilitan a Google los propietarios de los portales.
Dado que Internet está en constante crecimiento, Google utiliza unos programas informáticos llamados rastreadores web para encontrar portales de acceso público. Los rastreadores analizan el contenido de las páginas para ver qué ha cambiado respecto a versiones anteriores, y también siguen los enlaces que contienen para descubrir nuevas páginas y detectar los links rotos u obsoletos.
Los programas robots rastreadores se van moviendo de una web a otra como lo haría un usuario para después transmitir los datos recabados a los servidores de Google.
Tras recibir la información que los rastreadores recopilan sobre las páginas web, el siguiente paso es procesar y ordenar todos estos datos. La compañía toma como referencia una serie de indicadores clave de cada página, como las palabras clave utilizadas o la tasa de actualización, para después incluirla en el índice de la Búsqueda de Google.
Cuando haces una consulta en el motor, en realidad no estás haciendo una búsqueda en Internet, sino que estás buscando en el índice de la Búsqueda de Google. Por lo tanto, todo lo que no haya sido rastreado e indexado por la corporación queda fuera cuando utilizas el buscador.
Este índice contiene cientos de miles de millones de webs, que en total superan los 100.000.000 GB de información, y se organiza mediante entradas para cada palabra de cada página que ha sido indexada. Al indexar una página se añaden al índice todas las palabras que contiene.
El rastreo y la indexación es el trabajo previo que tiene que realizar Google para poder responder a las preguntas que los usuarios hacen a través del buscador.
¿Cómo selecciona el motor los resultados más relevantes para dar respuesta a cada consulta?
Google cuenta con sistemas de clasificación formados por un conjunto de algoritmos que analizan qué es lo que quieres encontrar para determinar la información que el buscador debe mostrarte en los resultados.
Para seleccionar estas páginas, Google analiza las palabras clave que has introducido para ver qué información es la más adecuada para dar una respuesta a tu consulta. A la hora de seleccionar los resultados, en primer lugar los algoritmos de Google analizan las palabras clave que ha introducido el usuario para determinar qué es lo que quiere decir con ellas y qué tipo de información quieres encontrar, este proceso es diferente dependiendo del idioma.
Los algoritmos evalúan la cantidad de veces que aparecen las palabras clave en la página, el lugar en el que se encuentran (encabezado, título, cuerpo del texto, etc.) y otras pistas que indiquen si el contenido de la página es relevante para el usuario.
Además, para elegir los resultados que va a mostrar, el buscador de Google tiene en cuenta el contexto, como la ubicación o el historial de búsquedas. De esta forma se asegura de que te ofrece las páginas más relevantes para ti.
No hay comentarios:
Publicar un comentario