Filtración de Google Revela detalles intrigantes sobre el SEO

Una reciente filtración de documentos internos de Google ha arrojado luz sobre los mecanismos y términos que impulsan su buscador, proporcionando una visión inédita de cómo la empresa maneja la optimización de motores de búsqueda (SEO). La información, divulgada por Rand Fishkin y Mike King, comprende más de 2.500 documentos y conceptos que, aunque no se sabe con certeza si todos están activos en la producción, ofrecen una comprensión más profunda de los procesos internos de Google.

Revelaciones Clave de la Filtración

Aunque la terminología utilizada por Google no siempre coincide con la que utilizan los profesionales del SEO, esta filtración confirma varias sospechas y revela nuevas facetas del funcionamiento del buscador. A continuación, se presenta una recopilación de términos relevantes descubiertos en los documentos filtrados.

AnchorMismatch

Este atributo evalúa si el texto de anclaje de un enlace coincide con el contenido de la página de destino. Si no coincide, el enlace es devaluado según el documento de señales de calidad comprimidas.

Ascorer

El sistema de ranking tradicional de Google, utilizado antes de que otros sistemas, como los de aprendizaje profundo, reorganicen los resultados. La «A» en Ascorer proviene de Amit Singhal, exjefe de Búsqueda de Google.

BabyPanda

Una versión evolucionada del algoritmo Panda, que puede aplicar devaluaciones adicionales sobre las impuestas por Panda.

BrainLoc

Un ranking de las principales ubicaciones por categorías, como países y ciudades.

CenterPiece

El contenido principal de una página, excluyendo menús, barras laterales y anuncios. Este concepto aparece en la Guía para Evaluadores de Calidad de Google.

Chunks

Fragmentos de una página o sitio necesarios para generar embeddings. Están relacionados con el sistema de Passage Ranking y la generación de Featured Snippets.

Coati

Una evolución de Panda que subsiste como sistema independiente hasta al menos noviembre de 2022.

CompositeDoc

Registro que almacena toda la información sobre un documento, vinculado a PerDoc.

ConstituencyTree

Un árbol de análisis sintáctico de frases utilizado por Google para entender las relaciones entre términos en un texto.

Embeddings

Representaciones numéricas de texto, palabras o frases que permiten a Google comprender y rankear documentos. Son esenciales en modelos como BERT y GPT-4.

ExactMatchDomainDemotion

Devaluación de dominios que contienen términos de búsqueda exactos.

Geostore

Sistema de anotaciones sobre el mapa para búsquedas con intención local.

Gobi / GobiSite

Sitios elevados para búsquedas específicas, como amazon.com para «hdtv».

Gold-standard

Páginas semilla elegidas manualmente para ser usadas en algoritmos.

Indextier

Tres niveles dentro del índice de Google, donde los enlaces de las páginas de mayor calidad tienen más valor.

Mustang

El sistema principal de indexación, ranking y servicio de Google.

Navboost / NavboostCraps

Modelo probabilístico basado en el historial de clics de usuarios para predecir clics en resultados específicos.

NLP

Procesamiento del lenguaje natural para entender mejor el contenido de las páginas.

PageRank

El algoritmo original para calcular la importancia de una página basado en los enlaces recibidos, aunque su versión actual en producción es PageRankNS.

PerDoc / PerDocData

Datos que Google guarda sobre un documento para su indexación y presentación en la SERP.

QualitySignals

Lista de todas las señales de calidad a nivel de página.

RankEmbed

Sistema de Deep Learning utilizado en la fase de re-ranking, entrenado con datos de usuarios.

SAFT

Framework de anotaciones estructuradas y herramientas para identificar y analizar entidades en una página.

SnippetBrain

Sistema para determinar los Featured Snippets y el texto específico que se muestra.

SuperRoot

El sistema central de procesamiento y almacenamiento de datos de la infraestructura de Google.

TeraGoogle

Índice de documentos con características específicas, almacenados principalmente en discos duros para estabilidad a largo plazo.

Conclusiones

Esta filtración proporciona una visión valiosa sobre cómo Google maneja el SEO y destaca la complejidad de su sistema de búsqueda. Aunque algunos términos y conceptos ya eran conocidos por la comunidad SEO, la profundidad y detalles revelados en estos documentos ofrecen nuevas oportunidades para optimizar páginas web de acuerdo con los criterios de Google.

La lista completa de términos y sus explicaciones detalladas están disponibles para aquellos interesados en profundizar en la optimización y comprensión del funcionamiento del buscador más utilizado del mundo.

Scroll al inicio