Stack Overflow y Reddit cobrarán a gigantes de la IA por acceso a datos de entrenamiento

Stack Overflow y Reddit planean cobrar a desarrolladores de inteligencia artificial a gran escala por el acceso a sus datos a partir de mediados de este año y junio, respectivamente. Tradicionalmente, empresas como OpenAI, Meta y Google han utilizado gran parte de sus datos de entrenamiento de forma gratuita, extrayéndolos de la web.

La decisión de buscar compensación de las empresas que utilizan sus datos forma parte de una estrategia más amplia de IA generativa. La News/Media Alliance también ha presentado principios que exigen a los desarrolladores de IA generativa negociar el uso de sus datos y respetar su derecho a una compensación justa.

La compensación adicional permitirá que Stack Overflow y Reddit sigan atrayendo usuarios y mantengan información de alta calidad, beneficiando a futuros chatbots que necesitan ser entrenados con información actualizada y de calidad. Sin embargo, la restricción en el acceso a datos valiosos también podría desalentar parte del entrenamiento de IA y ralentizar la mejora de los modelos de lenguaje de gran escala (LLM).

Los desarrolladores de IA enfrentan el desafío de reducir los enormes costos de desarrollo de sistemas de IA a gran escala, que requieren una gran cantidad de computadoras costosas. Tener que pagar por datos que antes obtenían de forma gratuita podría extender los plazos para obtener beneficios de sus tecnologías emergentes.

Scroll al inicio