Una reciente filtración de documentos internos de Google ha arrojado luz sobre los mecanismos y términos que impulsan su buscador, proporcionando una visión inédita de cómo la empresa maneja la optimización de motores de búsqueda (SEO). La información, divulgada por Rand Fishkin y Mike King, comprende más de 2.500 documentos y conceptos que, aunque no se sabe con certeza si todos están activos en la producción, ofrecen una comprensión más profunda de los procesos internos de Google.
Revelaciones Clave de la Filtración
Aunque la terminología utilizada por Google no siempre coincide con la que utilizan los profesionales del SEO, esta filtración confirma varias sospechas y revela nuevas facetas del funcionamiento del buscador. A continuación, se presenta una recopilación de términos relevantes descubiertos en los documentos filtrados.
AnchorMismatch
Este atributo evalúa si el texto de anclaje de un enlace coincide con el contenido de la página de destino. Si no coincide, el enlace es devaluado según el documento de señales de calidad comprimidas.
Ascorer
El sistema de ranking tradicional de Google, utilizado antes de que otros sistemas, como los de aprendizaje profundo, reorganicen los resultados. La «A» en Ascorer proviene de Amit Singhal, exjefe de Búsqueda de Google.
BabyPanda
Una versión evolucionada del algoritmo Panda, que puede aplicar devaluaciones adicionales sobre las impuestas por Panda.
BrainLoc
Un ranking de las principales ubicaciones por categorías, como países y ciudades.
CenterPiece
El contenido principal de una página, excluyendo menús, barras laterales y anuncios. Este concepto aparece en la Guía para Evaluadores de Calidad de Google.
Chunks
Fragmentos de una página o sitio necesarios para generar embeddings. Están relacionados con el sistema de Passage Ranking y la generación de Featured Snippets.
Coati
Una evolución de Panda que subsiste como sistema independiente hasta al menos noviembre de 2022.
CompositeDoc
Registro que almacena toda la información sobre un documento, vinculado a PerDoc.
ConstituencyTree
Un árbol de análisis sintáctico de frases utilizado por Google para entender las relaciones entre términos en un texto.
Embeddings
Representaciones numéricas de texto, palabras o frases que permiten a Google comprender y rankear documentos. Son esenciales en modelos como BERT y GPT-4.
ExactMatchDomainDemotion
Devaluación de dominios que contienen términos de búsqueda exactos.
Geostore
Sistema de anotaciones sobre el mapa para búsquedas con intención local.
Gobi / GobiSite
Sitios elevados para búsquedas específicas, como amazon.com para «hdtv».
Gold-standard
Páginas semilla elegidas manualmente para ser usadas en algoritmos.
Indextier
Tres niveles dentro del índice de Google, donde los enlaces de las páginas de mayor calidad tienen más valor.
Mustang
El sistema principal de indexación, ranking y servicio de Google.
Navboost / NavboostCraps
Modelo probabilístico basado en el historial de clics de usuarios para predecir clics en resultados específicos.
NLP
Procesamiento del lenguaje natural para entender mejor el contenido de las páginas.
PageRank
El algoritmo original para calcular la importancia de una página basado en los enlaces recibidos, aunque su versión actual en producción es PageRankNS.
PerDoc / PerDocData
Datos que Google guarda sobre un documento para su indexación y presentación en la SERP.
QualitySignals
Lista de todas las señales de calidad a nivel de página.
RankEmbed
Sistema de Deep Learning utilizado en la fase de re-ranking, entrenado con datos de usuarios.
SAFT
Framework de anotaciones estructuradas y herramientas para identificar y analizar entidades en una página.
SnippetBrain
Sistema para determinar los Featured Snippets y el texto específico que se muestra.
SuperRoot
El sistema central de procesamiento y almacenamiento de datos de la infraestructura de Google.
TeraGoogle
Índice de documentos con características específicas, almacenados principalmente en discos duros para estabilidad a largo plazo.
Conclusiones
Esta filtración proporciona una visión valiosa sobre cómo Google maneja el SEO y destaca la complejidad de su sistema de búsqueda. Aunque algunos términos y conceptos ya eran conocidos por la comunidad SEO, la profundidad y detalles revelados en estos documentos ofrecen nuevas oportunidades para optimizar páginas web de acuerdo con los criterios de Google.
La lista completa de términos y sus explicaciones detalladas están disponibles para aquellos interesados en profundizar en la optimización y comprensión del funcionamiento del buscador más utilizado del mundo.