Nuevas presentaciones judiciales en un caso de derechos de autor de IA contra Meta Add Credence a los informes anteriores de que la compañía “se detuvo” discusiones con los editores de libros sobre acuerdos de licencia para suministrar algunos de sus modelos generativos de IA con datos de capacitación.
Las presentaciones están relacionadas con el caso Kadrey v. Meta Platforms, uno de los muchos casos que se liquidan a través del sistema judicial de los Estados Unidos que enfrenta a las compañías de IA contra autores y otros titulares de propiedad intelectual. En su mayor parte, los acusados en estos casos, compañías de IA, han afirmado que la capacitación en contenido con derechos de autor es “uso justo”. Los demandantes, los titulares de derechos de autor, no han estado de acuerdo.
Las nuevas presentaciones presentadas a la corte el viernes, que incluyen transcripciones parciales de los deposiciones de meta empleados tomados por los abogados para los demandantes en el caso, sugieren que cierto meta personal sintió que negociar las licencias de datos de capacitación de IA para los libros podría no ser escalable.
Según una transcripción, Sy Choudhury, quien lidera las iniciativas de asociación de IA de Meta, dijo que la divulgación de Meta a varios editores se encontró con “una aceptación muy lenta en el compromiso y el interés”.
“No recuerdo toda la lista, pero recuerdo que habíamos hecho una larga lista al buscar inicialmente el Internet de los principales editores, etc.”, dijo Choudhury, según la transcripción, “y no recibimos contacto y comentarios de – De muchos de nuestros divultos de llamadas frías para tratar de establecer el contacto “.
Choudhury agregó: “Hubo algunos, como, que sí, ya sabes, se involucraron, pero no muchos”.
Según las transcripciones de la corte, Meta detuvo ciertos esfuerzos de licencia de libros relacionados con la IA a principios de abril de 2023 después de encontrarse con “tiempo” y otros contratiempos logísticos. Choudhury dijo que algunos editores, en particular los editores de libros de ficción, resultaron no tener los derechos sobre el contenido de que Meta estaba considerando licencias, según una transcripción.
“Me gustaría señalar que – En la categoría de ficción, aprendimos rápidamente del equipo de desarrollo de negocios que la mayoría de los editores con los que estábamos hablando, ellos mismos representaban que no tenían, en realidad, los derechos de licencia los datos para nosotros ”, dijo Choudhury. “Y así tomaría mucho tiempo interactuar con todos sus autores”.
Choudhury señaló durante su declaración que Meta tiene en al menos otra ocasión detuvo los esfuerzos de licencia relacionados con el desarrollo de la IA, según una transcripción.
“Soy consciente de los esfuerzos de licencia, por ejemplo, tratamos de licenciar mundos 3D de diferentes fabricantes de motores de juegos y juegos para nuestro equipo de investigación de IA”, dijo Choudhury. “Y de la misma manera que estoy describiendo aquí para la ficción y los datos de los libros de texto, tenemos muy poco compromiso para tener una conversación […] Decidimos, en ese caso, decidimos construir nuestra propia solución “.
El abogado de los demandantes, que incluyen a los autores más vendidos Sarah Silverman y Ta-Nehisi Coates, han modificado su queja varias veces desde que el caso se presentó en el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, la División de San Francisco en 2023. La última queja modificada Presentado por el abogado de los demandantes alega que Meta, entre otros delitos, referenciales cruzados ciertos libros pirateados con libros con derechos de autor disponibles para la licencia para determinar si tenía sentido seguir un acuerdo de licencia con un editor.
La queja también acusa a Meta de usar “bibliotecas de sombras” que contienen libros electrónicos pirateados para capacitar a varios de los modelos de IA de la compañía, incluida su popular serie de modelos “abiertos”. Según la queja, Meta puede haber asegurado algunas de las bibliotecas a través de torrenting. Torrenting, una forma de distribuir archivos en la web, requiere que los torrenters simultáneamente “semillas”, o cargues, los archivos que intentan obtener, que los demandantes afirmaron es una forma de infracción de derechos de autor.