Meta, la empresa matriz de Facebook e Instagram, ha tomado medidas drásticas contra los bots de rastreo web de Apple, conocidos como Applebot y Applebot-Extended, impidiendo que estos recopilen datos de sus plataformas para el entrenamiento de modelos de inteligencia artificial (IA).
Creciente tendencia de bloqueo
Esta acción de Meta no es un caso aislado. Otras importantes plataformas de noticias y redes sociales también han optado por bloquear el acceso de Apple a sus datos para el entrenamiento de IA. Entre estas se encuentran The New York Times, Vox Media, Tumblr, The Atlantic y Condé Nast.
Funciones de los bots de Apple
Applebot, el bot original de Apple, se utiliza principalmente para mejorar servicios como Siri y Spotlight, la herramienta de búsqueda de Apple. Por otro lado, Applebot-Extended, lanzado hace apenas tres meses, está diseñado específicamente para recopilar datos destinados al entrenamiento de modelos de IA.
Facilidad de exclusión
Una característica notable de Applebot-Extended es la facilidad con la que los editores pueden optar por no participar en este esquema de recopilación de datos. El proceso es tan simple como actualizar un archivo de texto público conocido como robots.txt.
Estadísticas de bloqueo
A pesar de la facilidad para optar por no participar, las estadísticas muestran que solo un 6-7% de los sitios web de alto tráfico han bloqueado a Applebot-Extended. En el sector de noticias, apenas el 25% de los medios han implementado este bloqueo. Estas cifras contrastan con el 53% que ha bloqueado el rastreador web de OpenAI y el 43% que ha bloqueado el de Google.
Posible desconocimiento
Los expertos sugieren que estas bajas tasas de bloqueo podrían deberse a un desconocimiento generalizado sobre la existencia del esquema de exclusión de Apple. Esta situación plantea interrogantes sobre la necesidad de una mayor difusión de información acerca de estas prácticas de recopilación de datos y las opciones disponibles para los propietarios de sitios web.