Como artistas, escritores y otros creadores Solicitud de regulación de la IA Los creadores de chatbot OpenAI y Anthropic enfrentan demandas por derechos de autor para proteger su trabajo y sus medios de vida Autor, los New York TimesY grupo de música universal , La investigación fue publicada el miércoles. descubrió que algunos de los mejores modelos de IA disponibles en la actualidad “generan contenido protegido por derechos de autor a un ritmo alarmantemente alto”.

Petronas AI, cofundada por ex investigadores de Meta y centrada en evaluar y probar LLM que impulsan a chatbots populares para detectar errores, lanzó el miércoles su herramienta CopyrightCatcher, que describió como “posibles violaciones de derechos de autor en LLM”. .

La compañía evaluó cuatro modelos principales de IA para derechos de autor: GPT-4 de OpenAI, Cloud 2.1 de Anthropic, Mixtral de Mistral y Llama 2 de Meta. De los cuatro modelos, dos de los cuales son de código abierto y dos de código cerrado, GPT-4, la versión más avanzada de ChatGPT, genera la mayor cantidad de contenido protegido por derechos de autor con un 44%. Según la investigación, Mixtral generó contenido con derechos de autor en el 22% de las señales, Llama 2 generó contenido con derechos de autor en el 10% de las señales y Cloud 2.1 generó contenido con derechos de autor en el 8% de las señales.

Patronus AI probó modelos utilizando libros protegidos por derechos de autor chica se ha ido y por Gillian Flynn un juego de tronos por George RR Martin, pero señalaron que algunas generaciones pueden estar cubiertas por leyes de uso legítimo en los EE. UU. Los investigadores pidieron al chatbot que completara los primeros extractos o textos de los libros.

Leer más, El mayor error del chatbot de IA (hasta ahora)

Los resultados de las pruebas mostraron que GPT-4 completó el texto del libro en el 60% del tiempo y generó el primer párrafo en el 26% del tiempo. Mientras tanto, Cloud completó el texto del libro en el 16% del tiempo, pero produjo el primer párrafo en el 0% del tiempo. Mixtral produjo el primer párrafo de los libros cuando se le pidió el 38% del tiempo y completó el pasaje el 6% del tiempo. Lama preparó los primeros párrafos y completó el texto el 10% del tiempo.

“Quizás sorprendentemente descubrimos que GPT-4 de OpenAI, que es posiblemente el modelo más poderoso que también utilizan muchas empresas y desarrolladores individuales, produjo contenido protegido por derechos de autor en el 44% de los mensajes que creamos”, dijo Rebecca Qian, co -fundador y director de tecnología de PETRONAS AI, le dijo a la cnbc,

OpenAI, Mistral, Meta y Anthropic no respondieron de inmediato a las solicitudes de comentarios.

Dado que los LLM están capacitados en datos que incluyen obras protegidas por derechos de autor, Petronas AI dijo que es “mucho más fácil” para los LLM generar reproducciones precisas del trabajo y evitar acciones legales y riesgos para la reputación de la empresa. Es importante detectar errores.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here