Tecnología

Es oficial: hay más robots que humanos navegando en páginas web

Durante el último año, el tráfico online a páginas web en todo el mundo registró un aumento interanual cercano al 20%, impulsado en gran medida por los bots utilizados por las grandes empresas tecnológicas para sostener la operación de sus buscadores en línea y entrenar a sus avanzados sistemas de inteligencia artificial (IA), de acuerdo con el análisis Year in Review 2025, elaborado por Cloudflare.

El informe detalla que el incremento se produjo en distintas fases. Hasta mediados de abril, tras varios meses de relativa estabilidad, el tráfico comenzó a crecer de forma gradual hasta alcanzar en mayo un aumento del 5% respecto al nivel de referencia, definido como el volumen diario registrado del 12 al 18 de enero sin considerar la actividad de los bots.

Este indicador se mantuvo con incrementos de entre 4 y 7% hasta mediados de agosto. Sin embargo, durante septiembre, octubre y noviembre se observó un crecimiento significativo y acelerado que, en conjunto, derivó en un aumento anual del 19%, cifra ligeramente superior al incremento del 17% reportado en 2024.


RSL es un estándar abierto y descentralizado de licencias que permitirá a los propietarios de contenidos definir cómo deben pagar los desarrolladores de IA por extraer información desde sus sitios web.


Google y Facebook continúan como los servicios en línea más utilizados a nivel global. No obstante, el reporte subraya el uso cada vez más intensivo de soluciones de IA generativa. En esta categoría, ChatGPT, de OpenAI, se mantiene como la plataforma más empleada. Aun así, herramientas como Perplexity, Claude, de Anthropic, y GitHub Copilot, de Microsoft, mejoraron su posicionamiento en comparación con el año anterior, mientras que servicios como Google Gemini, Windsurf AI, Grok/xAI y DeepSeek ingresaron por primera vez al top 10.

En conjunto, estas variaciones reflejan la rápida evolución de este sector emergente y, al mismo tiempo, intensifican las preocupaciones sobre la forma en que las grandes empresas tecnológicas utilizan el contenido disponible en la red para alimentar sus sistemas y ganar terreno en la competencia por el desarrollo de la IA.

Al respecto, el informe de Cloudflare destaca que “durante 2025, los bots y rastreadores de IA han sido noticia por su voraz consumo de contenido para entrenar modelos en constante evolución. Han generado controversia, ya que no todos los bots y rastreadores cumplen con las directrices establecidas por los propietarios de contenido para limitar la actividad de rastreo”. El documento sugiere que una proporción significativa del tráfico en línea parece depender ahora de estos sistemas automatizados, lo que resulta aún más preocupante.

Por otro lado, a inicios de año, los rastreadores de contenido no basados en IA fueron responsables de la mitad de las solicitudes a páginas HTML, un volumen que superó en siete puntos porcentuales al generado por los usuarios humanos. Esta diferencia se amplió hasta 25 puntos porcentuales a principios de junio. Aunque la brecha comenzó a reducirse en los meses posteriores, la distancia entre ambos grupos se mantuvo relativamente estrecha: a partir del 2 de diciembre, el tráfico humano representó el 47% de las solicitudes HTML, mientras que los bots no asociados a IA generaron el 44%, según el informe.

A este panorama se suma la participación de los bots de IA, que representaron en promedio el 4.2% del total de solicitudes a páginas HTML registradas a lo largo del año. A principios de abril, este indicador alcanzó un mínimo de 2.4%, mientras que a finales de junio llegó a una participación máxima de 6.4%.

Tráfico online al servicio de la IA

El reporte señala que la mayoría de los bots de IA se emplean con tres propósitos específicos: entrenamiento, para recopilar contenido de sitios web y entrenar modelos de IA; búsqueda, para indexar información y habilitar funciones de búsqueda dentro de las plataformas de IA, y acciones del usuario, para consultar páginas en respuesta a preguntas planteadas a un chatbot.

El rastreo destinado al entrenamiento de modelos es responsable de la gran mayoría del tráfico generado por rastreadores de IA, alcanzando hasta siete u ocho veces el volumen del rastreo para búsquedas y hasta 32 veces el correspondiente a acciones de los usuarios en los periodos de mayor actividad. El volumen de tráfico asociado al entrenamiento está fuertemente influenciado por GPTBot, de OpenAI”, precisa el documento.

DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/el-trafico-online-generado-por-bots-y-rastreadores-de-ia-supera-al-originado-por-los-humanos-segun-estudio

Publicaciones relacionadas

Botón volver arriba