Como muchas empresas de IA, Udio y Suno se basaron en robos a gran escala para crear sus modelos de IA generativa. Esto lo han admitido, incluso antes de que las nuevas demandas de la industria musical en su contra hayan llegado ante un juez. Si se presenta ante un jurado, el juicio podría ser a la vez una exposición perjudicial y un precedente muy útil para empresas de IA igualmente poco éticas que enfrentan ciertos peligros legales.
Las demandas fueron presentadas el lunes con gran fanfarria por la Recording Industry Association of America, colocándonos a todos en la incómoda posición de apoyar a la RIAA, que durante décadas ha sido el hombre del saco de los medios digitales. ¡Yo mismo he recibido desagradables mensajes de ellos! El caso es así de claro.
La esencia de las dos demandas, que son extremadamente similares en contenido, es que Suno y Udio (estrictamente hablando, Uncharted Labs que opera como Udio) saquearon indiscriminadamente más o menos toda la historia de la música grabada para formar conjuntos de datos, que luego utilizaron para entrenar una IA generadora de música.
Y aquí observemos rápidamente que estas IA no “generan” sino que hacen coincidir la indicación del usuario con los patrones de sus datos de entrenamiento y luego intentan completar ese patrón. En cierto modo, lo único que hacen estos modelos es realizar covers o mashups de las canciones que ingirieron.
Que Suno y Udio ingirieron dichos datos es, para todos los efectos (incluidos los legales), indiscutiblemente cierto. Los líderes y los inversionistas de las compañías han sido imprudentemente relajados acerca de los desafíos de derechos de autor en el espacio.
Han admitido que la única manera de crear un buen modelo de generación musical es ingerir una gran cantidad de música de alta calidad, gran parte de la cual estará protegida por derechos de autor. Es simplemente un paso necesario para crear modelos de aprendizaje automático de este tipo.
Luego admitieron que lo hicieron sin el permiso de los propietarios de los derechos de autor. El inversor Brian Hiatt dijo a Rolling Stone hace apenas unos meses:
Honestamente, si hubiéramos tenido acuerdos con sellos cuando comenzó esta empresa, probablemente no habría invertido en ella. Creo que necesitaban fabricar este producto sin limitaciones.
Dime que robaste un siglo de música sin decirme que robaste un siglo de música, entendido. Para ser claros, por “restricciones” se refiere a la ley de derechos de autor.
Por último, las empresas dijeron a los abogados de la RIAA que creen que robar todos estos medios cae dentro de la doctrina del uso legítimo, que fundamentalmente sólo entra en juego en el uso no autorizado de una obra. Ahora bien, es cierto que el uso legítimo es un concepto complejo y confuso en cuanto a idea y ejecución. Pero una empresa con 100 millones de dólares en sus bolsillos roba todas las canciones jamás realizadas para poder replicarlas en gran medida y vender los resultados: no soy abogado, pero eso parece desviarse un poco del puerto seguro previsto de, digamos, un estudiante de séptimo grado usando una canción de Pearl Jam como fondo de su video sobre el calentamiento global.
Para ser franco, parece que la gallina de estas empresas está cocida. Claramente esperaban poder seguir una página del manual de OpenAI, utilizando en secreto obras protegidas por derechos de autor y luego usando lenguaje evasivo y direcciones erróneas para detener a sus críticos menos adinerados, como autores y periodistas. Si cuando se revelan las artimañas de las empresas de IA, son la única opción de distribución, ya no importa.
En otras palabras: Negar, desviar, retrasar. Lo ideal es que puedas darle vueltas hasta que cambien las tornas y llegues a acuerdos con tus críticos: para los LLM, son los medios de comunicación y similares, y en este caso serían los sellos discográficos, a los que los generadores de música claramente esperaban llegar eventualmente desde una posición de poder. “Claro, te robamos tus cosas, pero ahora es un gran negocio; ¿No preferirías jugar con nosotros que contra nosotros? Es una estrategia común en Silicon Valley y ganadora, ya que principalmente cuesta dinero.
Pero es más difícil de lograr cuando tienes una pistola humeante en la mano. Y desafortunadamente para Udio y Suno, la RIAA incluyó algunos miles de pruebas irrefutables en la demanda: canciones de su propiedad que claramente están siendo regurgitadas por los modelos musicales. Jackson 5 o Maroon 5, las canciones “generadas” son simplemente versiones ligeramente confusas de los originales, algo que sería imposible si el original no estuviera incluido en los datos de entrenamiento.
La naturaleza de los LLM (específicamente, su tendencia a alucinar y perder la trama cuanto más escriben) impide la regurgitación de, por ejemplo, libros enteros. Esto probablemente ha generado una demanda por parte de los autores contra OpenAI, ya que este último puede afirmar de manera plausible que los fragmentos que cita su modelo fueron tomados de reseñas, primeras páginas disponibles en línea, etc. (El último movimiento en la portería es que hizo utiliza obras protegidas por derechos de autor desde el principio, pero ya no lo hizo, lo cual es gracioso porque es como decir que solo exprimiste jugo de naranja una vez pero ya no lo hiciste).
Lo que tu no poder Es plausible afirmar que su generador de música solo escuchó unos pocos compases de “Great Balls of Fire” y de alguna manera logró escupir el resto palabra por palabra y acorde por acorde. Cualquier juez o jurado se reiría en tu cara y, con suerte, un artista de la corte tendrá la oportunidad de ilustrarlo.
Esto no sólo es intuitivamente obvio sino que también tiene consecuencias jurídicas, ya que está claro que los modelos están recreando obras enteras (a veces mal, por supuesto, pero canciones completas). Esto permite a la RIAA afirmar que Udio y Suno están causando un daño real e importante a los negocios de los titulares de derechos de autor y a los artistas que están siendo regurgitados, lo que les permite pedir al juez que cierre todas las operaciones de las empresas de IA al comienzo del juicio con una mandato.
¿Los párrafos iniciales de su libro provienen de un LLM? Ésa es una cuestión intelectual que debe discutirse en profundidad. ¿“Llámame tal vez” de la tienda de un dólar generado a pedido? Apágalo. No digo que sea correcto, pero es probable.
La respuesta previsible de las empresas ha sido que el sistema no es destinado replicar obras protegidas por derechos de autor: un intento desesperado y desnudo de descargar la responsabilidad sobre los usuarios bajo el puerto seguro de la Sección 230. Es decir, de la misma manera que Instagram no es responsable si utilizas una canción con derechos de autor como respaldo de tu carrete. En este caso, parece poco probable que el argumento gane fuerza, en parte debido a las confesiones antes mencionadas de que, para empezar, la propia empresa ignoró los derechos de autor.
¿Cuál será la consecuencia de estos juicios? Como ocurre con todo lo relacionado con la IA, es bastante imposible decirlo con anticipación, ya que hay pocos precedentes o doctrina establecida y aplicable.
Mi predicción, que también carece de experiencia real, es que las empresas se verán obligadas a exponer sus datos y métodos de capacitación, cosas que tienen un claro interés probatorio. Ver estos y su evidente uso indebido de material protegido por derechos de autor, junto con (es probable) comunicaciones que indiquen que estaban infringiendo la ley, probablemente precipitará un intento de llegar a un acuerdo o evitar el juicio, y/o un juicio rápido contra Udio y Suno. También se verán obligados a detener cualquier operación que dependa de modelos basados en el robo. Al menos uno de los dos intentará continuar con el negocio utilizando fuentes de música legales (o al menos legalmente adyacentes), pero el modelo resultante supondrá un enorme descenso en calidad y los usuarios huirán.
¿Inversores? Lo ideal sería que perdieran la camisa al haber hecho sus apuestas en algo que era evidente y demostrablemente ilegal y poco ético, y no sólo a los ojos de las asociaciones de autores nebbish sino según las mentes jurídicas de la infame y despiadadamente litigiosa RIAA. Si los daños equivalen al efectivo disponible o a la financiación prometida es una incógnita.
Las consecuencias pueden ser de gran alcance: si los inversores en una nueva startup de medios generativos de repente ven cien millones de dólares vaporizados debido a la naturaleza fundamental de los medios generativos, de repente parece apropiado un nivel diferente de diligencia. Las empresas aprenderán del juicio (si lo hay) o de los documentos del acuerdo, etc., lo que se podría haber dicho, o quizás más importante, lo que no se debería haber dicho, para evitar responsabilidades y mantener a los titulares de derechos de autor adivinando.
Aunque esta demanda en particular parece casi una conclusión inevitable, no todas las empresas de inteligencia artificial dejan sus huellas dactilares en la escena del crimen con tanta liberalidad. No será un manual para procesar o forzar acuerdos con otras empresas de IA generativa, sino una lección objetiva de arrogancia. Es bueno tener uno de esos de vez en cuando, incluso si el profesor es la RIAA.