¿Como sabe Google lo que estoy buscando?

¿Cómo sabe Google lo que estoy buscando? IA en los resultados de búsqueda

Contenido

Saber responder a esta pregunta no solo nos ayuda a conseguir mejor información en nuestras búsquedas sino que también es vital para crear mejor contenido, apareciendo en los primeros resultados de búsqueda aumentando nuestra exposición, reputación y ventas. Conocer los procesos, herramientas y algoritmos que Google y otros de motores de búsqueda utilizan para proveernos con resultados es una ventaja estratégica que puede marcar la diferencia y el éxito entre la competencia.

Comprensión de Lenguaje

Ahora bien hay muchas cosas que intervienen en la entrega de resultados de búsqueda útiles y comprender el idioma es una de las habilidades más importantes. Gracias a los avances en inteligencia artificial y aprendizaje automático, los sistemas de búsqueda comprenden el lenguaje humano mejor que nunca. En los primeros días de la búsqueda, antes de que existiera una IA avanzada, los sistemas simplemente buscaban palabras coincidentes.

Por ejemplo: Si alguien buscaba la palabra sushi pero escribía “Suhsi” al menos que hubiera una página con ese mismo error ortográfico en particular, lo más probable era que la búsqueda no arrojada resultados o bien arrojara resultados diferente a la intención de búsqueda del usuario para la comida japonesa.

Resultados mostrados para la consulta “Suishi

Eventualmente los algoritmos aprendieron a encontrar clases de patrones, como errores ortográficos populares o errores tipográficos potenciales de las teclas vecinas. Ahora, con el aprendizaje automático avanzado, motores de búsqueda pueden reconocer de manera intuitiva si una palabra no se ve bien, sugerir una posible corrección o incluso aventurarse a mostrar aquellos resultados que consideran como aquellos que mejor coiniciden con la intención de búsqueda aunque los Keywords y la Consulta sean diferentes.

Este tipo de mejoras en los sistemas de búsqueda con Inteligencia Artificial significan que están mejorando constantemente la comprensión de lo que se está buscando. Y dado que el mundo y la curiosidad de las personas se mantienen en cambios constantes, es muy importante que la Búsqueda también lo haga. De hecho, el 15% del volumen de búsquedas diarias en Google son completamente nuevas, es decir no se han realizado nunca antes. La IA juega un papel importante al mostrarle resultados útiles, incluso en los límites más remotos de su imaginación.

Cómo interactúan sistemas de IA

Cientos de algoritmos interactúan en conjunto varios de ellos responden a los sistemas de ortografía, para ayudar a ofrecer resultados de búsqueda relevantes. Cuando se desarrollan nuevos sistemas de IA los algoritmos y sistemas heredados no se dejan de lado. De hecho, la búsqueda se ejecuta en cientos de algoritmos y modelos de aprendizaje automático, para esto es ideal que haya un funcionamiento conjunto de filtros y etapas.

Cada algoritmo y modelo tiene una función especializada y se activan en diferentes momentos y en distintas combinaciones para ayudar a brindar los resultados más útiles.

Sin embargo hay sistemas más avanzados juegan un papel más destacado que otros a continuación los presentamos.

Recuerda que puedes revisar las entradas dedicas a cada sistema de Google.

RankBrain: un sistema de clasificación más inteligente

RankBrain fue lanzado en 2015, fue el primer sistema de aprendizaje profundo (Deep Learning) implementado en la el motor de búsqueda de Google. En ese momento, fue innovador, no solo por ser el primer sistema de inteligencia artificial, sino también por ayudar a comprender cómo las palabras se relacionan con los conceptos.

Los humanos entendemos esto instintivamente, pero es un desafío complejo para una computadora. RankBrain ayuda a encontrar información que antes los buscadores eran incapaces de comprender de manera más amplia.

Frecuentemente las palabras en una búsqueda se relacionan con conceptos del mundo real. Por ejemplo, si se busca:

“Cuál es el corredor más rápido del mundo”

Sin embargo esta consulta es ambigua, pues las palabras clave “Cuál” Corredor” “rápido” y “mundo” pueden arrojar una variedad de resultados incluyendo especies del reino animal, corredores de automóviles, Formula 1, Nascar, Lanchas, Motocicletas o inclusive Speed Runners de Video Juegos o personajes de ficción Y nada en la consulta establece una categorización que indique un limite claro a los resultados sobre cierto deporte, especie o realidad.

Los sistemas tenderán a realizar un priorización de contenido basada en la semántica y los resultados de varios millones de sitios web. La consulta tenderá por frecuencia a arrojar resultados de corredores olímpicos especialmente resultados que puedan incluir las palabras “Usain Bolt” como el hombre que tiene el récord de velocidad actualmente.

El orden de los resultados se divide en las siguientes posiciones.

  1. Un fragmento de texto procesado a través de “Google Passage Rank” que de paso menciona a Usain Bolt.
  2. Un listado de preguntas relacionadas estás son otros “Queries o Consultas” Que google considera se han realizado con intenciones similares a la nuestra y han arrojado resultado satisfactoris.
  3. Resultados enriquecidos de videos sobre Usain Bolt y corredores olimpicos.
  4. (fuera de la imagén) Listado de links azules relacionados a corredores humanos y Usain Bolt.

Gracias a este tipo de comprensión, RankBrain (como sugiere su nombre) se usa para ayudar a clasificar, o decidir el mejor orden para los mejores resultados de búsqueda. RankBrain sigue siendo uno de los principales sistemas de inteligencia artificial que impulsan la búsqueda en la actualidad.

También te puede interesar.

La Heurística de Google.

Nota del editor.

La integración de redes neuronales, mecanismos de Deep Learning y de Inteligencia Artificial implica la creación de modelos heurísticos, pensamientos categóricos, simplificaciones y analogías de correlación porcentuales, propias de procesamientos paralelos. Un ejemplo claro de esto como la búsqueda de “Cuál es el corredor más rápido” arroja a Usain Bolt casi como si fuera un sinónimo de la consulta, virtualmente inseparable de los resultados de búsqueda salvo que se agregué o término modular como una fecha, especie, año u evento.

Neural matching | Coincidencia neuronal

Neural matching un sofisticado motor de recuperación de consultas, las redes neuronales sustentan muchos sistemas de IA modernos. Pero no fue hasta 2018, cuando se introdujo una IA para coincidencia neuronal en la Búsqueda, que se pudieron comprender mejor cómo se relacionan las consultas con las páginas.

La coincidencia neuronal ayuda a comprender representaciones más confusas de conceptos en consultas y páginas, y relacionarlos entre sí. Lo hace examinando una consulta o página completa en lugar de solo palabras clave, y desarrolla una mejor comprensión de los conceptos subyacentes representados en ellas.

Por ejemplo la búsqueda “desarrollo python“, por ejemplo. Incluso para la mayoría de personas esta es una pregunta difícil de comprender mucho más de dar una respuesta útil, ni pensar exacta. Pero con la coincidencia neuronal los motores de búsqueda pueden darle sentido. Al observar las representaciones más amplias de los conceptos en la consulta (administración, liderazgo, personalidad y más), la coincidencia neuronal puede descifrar que este usuario está buscando consejos de desarrollo, código y programación basada en código Python y no que está interesado en las etapas de la vida de una serpiente pitón, es por lo tanto que las páginas recomendadas por Google serán páginas relacionadas a código y no a reptiles y serpientes.

Cuando los sistemas comprenden los conceptos más amplios representados en una consulta o página, pueden relacionarlos más fácilmente. Este nivel de comprensión nos ayuda a generar una amplia red cuando analizamos nuestro índice en busca de contenido que pueda ser relevante para su consulta. Esto es lo que hace que la coincidencia neuronal sea una parte tan crítica de cómo recuperamos documentos relevantes de un flujo de información masivo y en constante cambio.

BERT

Bert un modelo para comprender el significado y el contexto fue lanzado en 2019, BERT fue un gran cambio en la comprensión del lenguaje natural, hecho para comprender cómo las combinaciones de palabras expresan diferentes significados e intenciones.

En lugar de simplemente buscar contenido que coincida con palabras individuales, BERT comprende cómo una combinación de palabras expresa una idea compleja. BERT entiende las palabras en una secuencia y cómo se relacionan entre sí, por lo que garantiza que no se eliminan palabras importantes de las consulta, sin importar cuán pequeñas sean.

¿Qué es BERT? Modelos de lenguaje de Google.
Bert Modelos de Lenguaje

Por ejemplo, si busca “puede obtener medicamentos para alguien en la farmacia”, BERT entiende que está tratando de averiguar si puede obtener medicamentos para otra persona. Antes de BERT, dábamos por sentada esa breve preposición, principalmente compartiendo resultados sobre cómo surtir una receta. Gracias a BERT, entendemos que incluso las palabras pequeñas pueden tener un gran significado.

Hoy, BERT juega un papel fundamental en casi todas las consultas en inglés. Esto se debe a que nuestros sistemas BERT se destacan en dos de las tareas más importantes para brindar resultados relevantes: clasificación y recuperación. En función de su comprensión del lenguaje complejo, BERT puede clasificar rápidamente los documentos según su relevancia. También hemos mejorado los sistemas heredados con capacitación BERT, haciéndolos más útiles para recuperar documentos relevantes para la clasificación. Y aunque BERT desempeña un papel importante en la búsqueda, nunca funciona solo; como todos nuestros sistemas, BERT es parte de un conjunto de sistemas que trabajan juntos para compartir resultados de alta calidad.

MUM

MUM es un acrónimo de Multitask Unified Model procesos que van del lenguaje a la comprensión de la información. En mayo de 2021 Google presentó una nueva IA en la búsqueda: modelo unificado multitarea o MUM. Mil veces más potente que BERT, MUM es capaz tanto de comprender como de generar lenguaje. Está entrenado en 75 idiomas y muchas tareas diferentes a la vez, lo que le permite desarrollar una comprensión más completa de la información y el conocimiento del mundo. MUM también es multimodal, lo que significa que puede comprender información en múltiples modalidades, como texto, imágenes y más en el futuro.

Si bien todavía estamos en los primeros días de aprovechar el potencial de MUM, ya lose ha usado para mejorar las búsquedas de información sobre la vacuna COVID-19, y ofrece además formas más intuitivas de buscar usando una combinación de texto e imágenes en Google Lens. Estas son aplicaciones muy especializadas, por lo que MUM no se usa actualmente para ayudar a clasificar y mejorar la calidad de los resultados de búsqueda como lo hacen RankBrain, la coincidencia neuronal y los sistemas BERT.

Las capacidades de MUM se implementarán progresivamente en los Motores de Búsqueda de Google.

Para más información sobre SEO, Mercadeo, Digital y Comercio electrónico sigue nuestro Blog.