Inteligencia Artificial

El talón de Aquiles de ChatGPT es que no puede funcionar sin robar contenido

David Soriano Publicado el 10 de enero, 2024 • 18:30

El mundo de la Inteligencia Artificial tal y como lo conocemos podría cambiar para siempre con la guerra que tiene OpenAI, creadores de ChatGPT, contra algunos autores y medios que han denunciado que se han incluido sus contenidos protegidos para entrenar al sistema, lo que vulnera las leyes de copyright.

Lejos de itir su culpa, OpenAI se ha defendido de una manera cuanto menos curiosa, reconociendo que sin estos datos de interés, por mucho que tengan copyright, los chatbots de IA serían poco más que herramientas inútiles si solamente usaran contenido no protegido.

ChatGPT y el uso de contenidos con copyright

En las últimas semanas, OpenAI, la empresa detrás del fenómeno ChatGPT, ha estado en boca de todos a raíz de la denuncia del New York Time el pasado 27 de diciembre de 2023 ante el Tribunal Federal del Distrito de Manhattan. El mítico periódico denunció que se han utilizado millones de artículos e investigaciones para entrenar al modelo de lenguaje detrás de la tecnología GPT-4. Esto, según los afectados, es una vulneración de los derechos de autor y otros contenidos que se han utilizado sin autorización para entrenar chatbots.

OpenAI y otras empresas rivales han sido acusadas de aprovecharse ilegalmente del trabajo de otros autores y artistas. Este uso no ético del trabajo realizado por terceros se acentúa todavía más desde el punto de vista de que ChatGPT y otras

Parece ser que según los responsables de OpenAI, basar los entrenamientos de sus modelos de lenguaje solamente en contenido no protegido volvería prácticamente inútiles e inservibles sus creaciones.

“Debido a que los derechos de autor hoy cubren prácticamente todo tipo de expresión humana, incluidas publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor. Limitar los datos de entrenamiento a libros y dibujos de dominio público creados hace más de un siglo podría generar un experimento interesante, pero no proporcionaría sistemas de inteligencia artificial que satisfagan las necesidades de los ciudadanos de hoy”.

¿Están entonces cometiendo un delito? Según OpenAI no, ya que cumplen con todas las leyes de derechos de autor al entrenar sus modelos porque “creemos que legalmente las leyes de derechos de autor no prohíben el entrenamiento”.