Google utiliza diferentes sistemas de Rankeo y clasificación automatizados que analizan muchos factores y señalan cientos de miles de millones de páginas web y otro contenido en nuestro índice de búsqueda para presentar los resultados más relevantes y útiles, todo en una fracción de segundo.
Esta entrada es una guía para comprender algunos de los sistemas de clasificación más importante. Abarca algunos sistemas y algoritmos que forman parte de los sistemas de clasificación principales, que son las tecnologías subyacentes que producen resultados de búsqueda en respuesta a las consultas y también cubre algunos sistemas involucrados con necesidades específicas de clasificación.
BERT
Las representaciones de codificador bidireccional de los transformadores (BERT) es un sistema de IA que usa Google que nos permite comprender cómo las combinaciones de palabras expresan diferentes significados e intenciones.
También te puede interesar
Sistemas de información de crisis
Google ha desarrollado sistemas para brindar información útil y oportuna durante tiempos de crisis, ya sea que se trate de situaciones de crisis personales, desastres naturales u otras situaciones de crisis generalizadas:
Crisis personal
Los algoritmos de búsqueda de Google intentan comprender cuándo las personas buscan información sobre situaciones de crisis personal para mostrar líneas directas y contenido de organizaciones confiables para ciertas consultas relacionadas con suicidio, agresión sexual, ingesta de veneno, violencia de género o adicción a las drogas.
Alertas SOS
Durante emergencias y catástrofes, como desastres naturales, ataques terroristas o situaciones de crisis generalizadas, se disparan sistemas de Alertas SOS para mostrar actualizaciones de las autoridades locales, nacionales o internacionales. Estas actualizaciones pueden incluir números de teléfono y sitios web de emergencia, mapas, traducciones de frases útiles, oportunidades de donación y más.
Sistemas de deduplicación
Las búsquedas en Google pueden encontrar miles o incluso millones de páginas web con contenido en extremo similar entre sí. En tales casos, Google muestra como resultado únicamente aquellos que se consideran como los más relevantes para evitar duplicaciones inútiles de los resultados SERP.
La deduplicación también ocurre con fragmentos destacados. Si una lista de páginas web se eleva para convertirse en un fragmento destacado, no repetimos la lista más adelante en la primera página de resultados. Esto ordena los resultados y ayuda a las personas a localizar la información relevante más fácilmente.
Sistema de dominio de coincidencia exacta
Google toma en consideración las palabras de los nombres de dominio como uno de los muchos factores para determinar si el contenido es relevante para una búsqueda sin embargo, el sistema de coincidencia exacta de dominios funciona para garantizar que no se le da prioridad al contenido alojado en dominios diseñados para coincidir exactamente con consultas particulares.
Por ejemplo, alguien podría crear un nombre de dominio que contenga las palabras “mejores-lugares-para-comer-el-almuerzo” con la esperanza de que todas esas palabras en el nombre de dominio impulsen el contenido en lo más alto de las clasificaciones, para evitar estas analogías rápidas y quizás falaces se activan algoritmos como Passage Rank y Helpful Content para asegurar que el contenido aún en un sitio con un nombre de dominio no relacionado muestre aquella información más relevante para el usuario.
Sistemas de frescura
El tiempo cambia las cosas, aquellos restaurantes que eran sensación hace 10 años puede que ya no lo sean hoy o quizás ni siquiera permanezcan abiertos. Los sistemas de “Frescura de Contenido” están diseñados para mostrar contenido más actualizado para consultas donde se esperaría contenido fresco como “10 mejores restaurantes de Sushí en Monteverde”.
Por ejemplo, si alguien está buscando una película que acaba de estrenarse, probablemente quiera reseñas recientes en lugar de artículos más antiguos de cuando comenzó la producción.
Otro ejemplo, normalmente una búsqueda de “terremoto” podría traer material sobre preparación y recursos. Sin embargo, si ocurrió un terremoto recientemente, es posible que aparezcan artículos de noticias y contenido más reciente.
Sistema de contenido útil
El sistema de contenido útil está diseñado para garantizar mejor que las personas vean contenido original y útil escrito por personas, para personas, en los resultados de búsqueda, en lugar de contenido creado principalmente para obtener tráfico de motores de búsqueda. Esta es una de los agregados más recientes e importantes en el algoritmo de Google y en buena parte está pensando para combatir la proliferación de contenido creado por Inteligencia Artificial.
Sistemas de análisis de enlaces y PageRank
Tenemos varios sistemas que entienden cómo las páginas se vinculan entre sí como una forma de determinar de qué páginas tratan y cuáles pueden ser más útiles en respuesta a una consulta. Entre estos se encuentra PageRank, uno de nuestros principales sistemas de clasificación que se utilizó cuando Google se lanzó por primera vez. Los curiosos pueden obtener más información leyendo el documento de investigación y la patente originales de PageRank. El funcionamiento de PageRank ha evolucionado mucho desde entonces y continúa siendo parte de nuestros sistemas de clasificación principales.
También te puede interesar
Sistemas de noticias locales
Google utiliza sistemas que funcionan para identificar y mostrar fuentes locales de noticias siempre que sea relevante, como a través de nuestras funciones “Historias destacadas” y “Noticias locales”.
MUM
El Modelo Unificado Multitarea (MUM) es un sistema de Inteligencia Artificial, capaz de comprender y generar lenguaje. Actualmente no se usa para la clasificación general en la Búsqueda, sino para algunas aplicaciones específicas, como mejorar las búsquedas de información sobre la vacuna COVID-19 y para mejorar las llamadas de fragmentos destacados que mostramos.
Emparejamiento neuronal
La coincidencia neuronal es un sistema de inteligencia artificial que utiliza Google para comprender las representaciones de conceptos en consultas y páginas y relacionarlos entre sí.
Sistemas de contenido original
Google utiliza algoritmos de búsqueda y descubrimiento de contenido origina con el fin de promover este tipo de manera destacada en los resultados de búsqueda, incluidos los informes originales, por delante de aquellos que simplemente lo citan. Esto incluye la compatibilidad con un marcado canónico especial que los creadores pueden usar para ayudar a Google a comprender mejor cuál es la página principal si una página se ha duplicado en varios lugares.
Sistemas de degradación basados en eliminación
Google tiene políticas que permiten la eliminación de ciertos tipos de contenido. Esta proceso es uno de los más polémicos y peligrosos, frecuentemente manchado por la intervención de ideologías políticas y de estados en la preservación de sus narrativas, así como la consonancia y la promoción artificial de medios tradiciones y hegemónicos y de Lobbies privados poderosos.
Es importante considerarlo pues sí Google procesa repetidas eliminaciones relacionadas en un sitio en particular, podría castigar la visibilidad de dicho sitio y su contenido.
Eliminaciones legales
Es cuando Google recibe un gran volumen de solicitudes válidas de eliminación de derechos de autor relacionadas con un sitio determinado, degradando la posición del sitio en los resultados de búsqueda. De esta manera, si hay otro contenido infractor, es menos probable que las personas lo encuentren en comparación con el contenido original.
Google dice aplicar señales de degradación similares a las denuncias relacionadas con difamación, productos falsificados y ordenes de tribunales.
Eliminaciones de información personal
Estas proceden cuando información personal que involucran un sitio con prácticas de explotación difamación o chantaje, nuevamente el contenido del sitio aparecerá con menos frecuencia en los resultados de búsqueda.
También observamos si el mismo patrón de comportamiento está ocurriendo con otros sitios y, de ser así, aplicamos degradaciones al contenido de esos sitios. Google también aplica prácticas de degradación similares para los sitios que reciben un alto volumen de eliminaciones de contenido doxxing.
También te puede interesar
Sistema de experiencia de página
La gente prefiere sitios que ofrecen una gran experiencia de página. Por esto Google tiene un sistema de experiencia de página que evalúa una variedad de criterios, como la rapidez con la que se cargan las páginas, la compatibilidad con dispositivos móviles, si las páginas carecen de intersticiales intrusivos y si las páginas se publican y se encuentra alojadas de manera segura.
En situaciones en las que hay muchas coincidencias posibles para un Query con una relevancia relativamente similar, el sistema ayuda a dar preferencia al contenido con una mejor experiencia de página.
Google Passage Rank.
La clasificación de pasajes es un sistema de inteligencia utilizado para identificar secciones individuales o “pasajes” de una página web para comprender mejor qué tan relevante es una página para una búsqueda.
Sistema de reseñas de productos
El sistema de reseñas de productos tiene como objetivo recompensar mejor las reseñas de productos de alta calidad, el contenido que proporciona un análisis perspicaz y una investigación original, y está escrito por expertos o entusiastas que conocen bien el tema. Esto es especialmente relevante para aquellos blogs y creadores de contenido especializados en hacer reseñas con el fin de conseguir ingresos através de sistemas de ventas de afiliados (afíliate marketing)
RankBrain
RankBrain es un sistema de inteligencia artificial ayuda a comprender cómo se relacionan las palabras con los conceptos. Implica la capacidad de dar resultados y promover contenido relevante a la consulta, incluso si la consulta no contiene todas las palabras exactas utilizadas en la búsqueda, al comprender que el contenido está relacionado con otras palabras y conceptos.
Sistemas de información confiables
Múltiples sistemas funcionan de varias maneras para mostrar la información más confiable posible, como para ayudar a mostrar páginas más autorizadas y degradar el contenido de baja calidad y elevar el periodismo de calidad.
En los casos en los que pueda faltar información confiable Google muestra automáticamente avisos de contenido sobre temas que cambian rápidamente o cuando nuestros sistemas no tienen mucha confianza en la calidad general de los resultados disponibles para la búsqueda. Estos proporcionan consejos sobre cómo buscar de manera que puedan conducir a resultados más útiles. Obtén más información sobre nuestro enfoque para ofrecer información de alta calidad en la Búsqueda.
Sistema de diversidad de sitios
El sistema de diversidad de sitios funciona de modo que, por lo general, un mismo sitio no aparezca más de una vez como resultado principal a una misma consulta., de modo que ningún sitio tienda a dominar todos los resultados principales.
Sin embargo, Google puede hacer excepciones a esto en los casos en que los sistemas determinan que es especialmente relevante hacerlo para una búsqueda en particular.
La diversidad de sitios generalmente trata los subdominios como parte de un dominio raíz. IE: los listados de un subdominio (subdominio.example.com) y el dominio raíz (example.com) se considerarán todos del mismo sitio único. Sin embargo, a veces los subdominios se tratan como sitios separados para fines de diversidad cuando se considera relevante hacerlo.
Sistemas de detección de spam
Nadie quiere que su bandeja de entrada de correo electrónico se llene de spam, por lo que los filtros de spam son tan útiles. La búsqueda se enfrenta a un desafío similar, porque Internet incluye enormes cantidades de spam que, si no se solucionan, impide mostrar los resultados más útiles y relevantes.
Sistemas como SpamBrain trata el contenido y los comportamientos que violan las políticas de spam de Google. Estos sistemas se actualizan constantemente para mantenerse al día con las últimas formas en que evoluciona la amenaza del spam.