Cloudflare cambia las reglas del SEO frente a los bots de IA

Cloudflare ha puesto fecha a una discusión que llevaba meses creciendo en silencio entre medios, empresas tecnológicas, responsables de marketing y proveedores de inteligencia artificial. A partir del 15 de septiembre de 2026, la compañía cambiará sus ajustes por defecto para bloquear en páginas con publicidad a los rastreadores de entrenamiento y agentes de IA en nuevos dominios incorporados a su red. El rastreo de búsqueda seguirá permitido por defecto, pero los bots de uso mixto, aquellos que combinan búsqueda, entrenamiento y funciones de agente, quedarán sometidos a la regla más restrictiva si el propietario decide bloquear el uso para entrenamiento.

El cambio parece técnico, pero toca el corazón económico de internet. Durante años, muchas webs han aceptado una especie de pacto no escrito: permitir el rastreo a cambio de visibilidad en buscadores. La inteligencia artificial ha alterado esa relación. Ahora el contenido no solo sirve para generar enlaces en una página de resultados, sino también para entrenar modelos, alimentar respuestas automáticas y resolver consultas sin que el usuario visite la fuente original.

El nuevo conflicto: ser visible o proteger el contenido

Cloudflare distingue tres grandes usos del tráfico automatizado: búsqueda, agentes y entrenamiento. La búsqueda tradicional rastrea páginas para crear índices y devolver enlaces. Los agentes visitan webs para realizar tareas o extraer información en nombre de un usuario. El entrenamiento utiliza contenido para mejorar o ajustar modelos de inteligencia artificial.

La separación parece razonable, pero el problema aparece cuando un mismo rastreador sirve para varios fines. Según Cloudflare, los bots de uso mixto que combinan búsqueda y entrenamiento, entre ellos Googlebot, Applebot o BingBot, podrán quedar bloqueados si el propietario de la web ha elegido impedir el uso de su contenido para entrenar IA. La compañía sostiene que esta medida busca presionar a las grandes plataformas para que separen sus crawlers y declaren con más claridad qué hacen cuando acceden a una página.

Para un medio digital, un blog especializado o una empresa española que vive de captar demanda en Google, la decisión no es menor. Bloquear el uso del contenido para IA puede proteger artículos, comparativas, análisis técnicos o guías de compra. Pero si ese bloqueo termina afectando a rastreadores que también sirven para búsqueda, el coste puede ser la pérdida de visibilidad orgánica.

Google defiende que sus funciones de IA en la búsqueda se apoyan en los fundamentos habituales del SEO: una página debe estar indexada, ser apta para mostrarse en Google Search y cumplir los requisitos técnicos de rastreo y fragmentos. También remite a Google-Extended para limitar el entrenamiento y el uso en algunos de sus otros sistemas. Pero Cloudflare considera que la frontera entre descubrimiento y consumo generado por IA se está difuminando, sobre todo con funciones como AI Overviews y AI Mode.

La consecuencia práctica es incómoda. Las empresas ya no pueden mirar el archivo robots.txt, el CDN o las reglas de seguridad como un asunto puramente técnico. Es una decisión de negocio. Un portal financiero, una web de recetas, una tienda online con miles de fichas trabajadas o una consultora que publica informes puede estar alimentando respuestas de IA que reducen la visita humana a su propia página.

La economía del rastreo entra en fase de pago

Cloudflare no solo plantea bloquear. También quiere crear una capa de mercado para que los editores cobren cuando su contenido tenga valor para sistemas de IA. Su modelo Pay Per Crawl, todavía en beta cerrada según la documentación de la compañía, permite a los propietarios de sitios fijar un precio por zona y responder con un código HTTP 402 Payment Required cuando un rastreador de IA intenta acceder sin intención de pago.

La evolución que propone ahora va un paso más allá: pasar de cobrar por rastrear a cobrar por uso real. Cloudflare llama a ese enfoque Pay Per Use y lo está trabajando con socios como Ceramic.ai y You.com. La idea es que un editor no cobre simplemente porque un bot descargue una página, sino cuando ese contenido aparezca o aporte valor dentro de una respuesta generada por IA.

Sobre el papel, el cambio corrige una distorsión evidente. Muchos rastreadores descargan páginas una y otra vez, aunque el contenido no haya cambiado. Eso consume ancho de banda, carga servidores y aporta poco al editor. Cloudflare afirma que, en junio de 2026, el 52 % de las peticiones de crawlers identificadas por propósito ya estaban ligadas al entrenamiento de IA, frente al 22 % de la primavera de 2025. También calcula que los rastreadores de uso mixto representan más del 36 % de la actividad.

La pregunta es si ese mercado será suficiente para compensar la caída de tráfico humano. Cloudflare sostiene que más del 50 % del tráfico de internet ya es no humano y que muchas categorías muy rastreadas han visto descensos de tráfico humano de hasta el 40 % en menos de un año. Además, sitúa a Google como una puerta de entrada dominante, con cerca del 88 % del tráfico de referencia, lo que explica por qué la separación entre búsqueda e IA se ha vuelto tan sensible para los editores.

El pago por uso puede favorecer a contenidos premium: análisis financieros, bases de datos sectoriales, documentación técnica, comparativas profesionales o investigaciones originales. Pero no resolverá de golpe el problema de todos los creadores. Un medio pequeño difícilmente negociará igual que un gran grupo editorial. Una web de nicho puede tener contenido valioso, pero necesitará atribución, métricas, acuerdos y capacidad técnica para defenderlo.

Qué deberían revisar las empresas españolas

El efecto en España será desigual. Los grandes medios y grupos editoriales podrán negociar licencias, revisar contratos y usar herramientas avanzadas de control. Las pymes, blogs profesionales, agencias y comercios online tendrán que tomar decisiones más operativas: qué permiten rastrear, qué bloquean, qué contenido reservan y cuánto dependen del tráfico orgánico.

La primera revisión debería ser técnica. Conviene comprobar robots.txt, reglas de Cloudflare, configuración de WAF, permisos de bots, Search Console, logs de servidor y comportamiento de rastreadores en páginas con publicidad. También merece la pena separar tipos de contenido. No es lo mismo una noticia gratuita que una guía técnica de alto valor, una base de datos propia o una ficha de producto creada con inversión editorial.

La segunda revisión es económica. Si una web depende de publicidad programática, afiliación o captación SEO, bloquear de forma agresiva puede reducir ingresos antes de que exista una alternativa clara de pago por IA. Si el contenido tiene valor profesional y diferencial, permitir todo sin condiciones puede equivaler a entregar gratis un activo que luego compite contra la fuente original en buscadores conversacionales.

La tercera revisión es estratégica. El SEO clásico seguirá importando, pero cada vez convivirá más con la visibilidad en respuestas generativas, asistentes y agentes. Aparecer en Google ya no garantiza que el usuario visite la página. Y aparecer en una respuesta de IA puede aportar marca, autoridad o ventas indirectas, pero solo si existe atribución y una forma de medir ese valor.

Cloudflare ocupa una posición singular porque más del 20 % de la web se encuentra detrás de su red, que opera en más de 330 ciudades y más de 100 países. Por eso sus cambios no son una simple opción de configuración para administradores. Pueden acelerar una nueva negociación entre quienes publican contenido, quienes lo rastrean y quienes lo convierten en productos de IA.

El fondo del debate ya no es si los bots pueden leer internet. Lo hacen desde hace años. La cuestión es si una empresa puede seguir financiando contenido con visitas humanas cuando las respuestas automáticas capturan parte de ese valor antes del clic. Cloudflare ha colocado el dilema sobre la mesa: proteger, permitir o cobrar. Ninguna opción será neutral.

Preguntas frecuentes

¿Qué cambia Cloudflare el 15 de septiembre de 2026?
Cloudflare cambiará ajustes por defecto para bloquear bots de entrenamiento y agentes de IA en páginas con publicidad de nuevos dominios. Los bots de búsqueda seguirán permitidos, pero los rastreadores de uso mixto pueden verse afectados si combinan búsqueda y entrenamiento.

¿Puede una web perder visibilidad en buscadores por bloquear IA?
Existe riesgo si el bloqueo afecta a crawlers de uso mixto que también participan en búsqueda. Por eso Cloudflare recomienda gestionar por separado búsqueda, agentes y entrenamiento, y revisar la configuración antes de aplicar reglas generales.

¿Qué es Pay Per Use?
Es el modelo con el que Cloudflare quiere que los editores cobren cuando su contenido aporte valor real a una respuesta de IA, no solo cuando un bot descargue una página.

¿Qué deberían hacer medios y empresas en España?
Auditar sus reglas de rastreo, medir dependencia del SEO, identificar contenidos de alto valor y decidir qué partes permiten para búsqueda, cuáles bloquean para entrenamiento y cuáles podrían monetizar mediante acuerdos o plataformas de pago por uso.

El nuevo conflicto: ser visible o proteger el contenido

La economía del rastreo entra en fase de pago

Qué deberían revisar las empresas españolas

Preguntas frecuentes

Te puede interesar...