Editores crean protocolo para cobrar por el uso de sus obras en el entrenamiento de la IA

Un nuevo estándar busca dar respuesta a las demandas de los dueños de obras protegidas por derechos de autor que denuncian el uso de sus contenidos sin autorización ni remuneración para entrenar y sostener el funcionamiento de diversos modelos de inteligencia artificial (IA). La propuesta, denominada Really Simple Licensing (RSL), pretende “ofrecer una compensación justa y estandarizada” a los creadores, además de facilitar a las empresas tecnológicas el acceso legal a datos de entrenamiento.
El protocolo fue diseñado por el Colectivo RSL, una organización de derechos de autor fundada recientemente por Eckart Walther, cocreador del estándar Really Simple Syndication (RSS), y Doug Leeds, exdirector ejecutivo de IAC Publishing.
De acuerdo con sus impulsores, RSL es un modelo abierto y descentralizado de licencias que permitirá a los propietarios de contenidos definir cómo deben pagar los desarrolladores de IA por extraer información desde sus sitios web. Su estructura se inspira en el RSS, una tecnología que popularizó la sindicación de contenidos online al posibilitar que los usuarios se suscribieran a actualizaciones de portales de su interés y recibieran un resumen de noticias o información en agregadores.
Tim O’Reilly, director ejecutivo de O’Reilly Media, explicó que el RSS permitió a los primeros editores en línea distribuir masivamente su contenido, lo que resultó decisivo para la evolución de internet como ecosistema informativo. “Pero hoy, a medida que los sistemas de IA absorben y reutilizan ese mismo contenido sin permiso ni compensación, las normas deben evolucionar. RSL proporciona la capa de licencias que faltaba y garantiza que los creadores que impulsan la innovación en IA no solo formen parte de la conversación, sino que también reciban una retribución justa por el valor que generan”, afirmó.
Cómo funciona el estándar que pretende regular el “raspado” de la IA
Desde hace años, la mayoría de los sitios web emplea el archivo robots.txt para indicar a los rastreadores —como los de los motores de búsqueda— a qué secciones pueden acceder y cuáles están restringidas. A diferencia de este protocolo, RSL no solo regula el acceso de los bots, sino que permite añadir términos de licencias y regalías dentro del robots.txt.
El estándar contempla distintos modelos de uso y pago, entre ellos: gratuidad, atribución, suscripción, pago por rastreo (compensación cada vez que una aplicación de IA rastrea contenido) y pago por inferencia (compensación cuando el material se utiliza para generar una respuesta).
Varias compañías ya respaldan la iniciativa. Entre ellas se encuentran Reddit, People Inc., Yahoo, Internet Brands, Ziff Davis, wikiHow, O’Reilly Media, Medium, The Daily Beast, Miso.AI, Raptive, Ranker y Evolve Media. Asimismo, firmas como Fastly, Quora y Adweek han comenzado a implementar el protocolo.
La IA sin datos de calidad
Diversos estudios advierten que las empresas tecnológicas enfrentan una creciente escasez de datos de calidad para entrenar algoritmos de IA, a medida que avanza la propia tecnología. Para mitigar el problema, organizaciones como Google han recurrido a datos sintéticos: contenidos creados por sistemas de IA a partir de información existente. Sin embargo, la fiabilidad de este método es cuestionada, pues los especialistas consideran que no puede sustituir al conocimiento generado por el intelecto humano.
En este contexto, los editores han denunciado reiteradamente que los desarrolladores de IA aprovechan vacíos legales para emplear obras protegidas por derechos de autor en el entrenamiento de modelos, sin autorización ni retribución.
En mayo, la organización sin fines de lucro News Media Alliance —que agrupa a más de 2,200 medios impresos y digitales— encabezó la última gran acusación. Señaló que el nuevo “Modo IA” de Google Search utiliza contenidos de miles de publicaciones sin permiso, afectando de manera directa su capacidad para obtener ingresos.
Danielle Coffey, presidenta y directora ejecutiva de la alianza, advirtió que este modelo equivale a una apropiación indebida de propiedad intelectual que perjudica gravemente al periodismo. “Los enlaces eran el último recurso para generar tráfico e ingresos. Ahora Google simplemente toma el contenido y lo usa sin ofrecer nada a cambio. Eso es un robo. El Departamento de Justicia debe intervenir para evitar que una sola empresa continúe controlando el ecosistema digital”, reclamó.
El RSL intenta dar una salida a estas preocupaciones. Sus desarrolladores sostienen que “con este estándar como clave tecnológica, la industria de internet dispone ahora de la infraestructura necesaria para aplicar un modelo de licencias colectivas en la red: establecer precios de mercado justos y fortalecer la capacidad de negociación de todos los editores”.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/editores-crean-protocolo-para-cobrar-por-el-uso-de-sus-obras-en-el-entrenamiento-de-la-ia