Home Tecnología MlCommons y Hugging Face Team Up para lanzar un conjunto de datos de habla masiva para la investigación de IA

MlCommons y Hugging Face Team Up para lanzar un conjunto de datos de habla masiva para la investigación de IA

by internauta
0 comment


MlCommons, un grupo de trabajo de seguridad de IA sin fines de lucro, se ha asociado con la plataforma de desarrollo de IA que abraza a Face para lanzar una de las colecciones más grandes del mundo de grabaciones de voz de dominio público para la investigación de IA.

El conjunto de datos, llamado discurso de personas sin supervisión, contiene más de un millón de horas de audio que abarca al menos 89 idiomas diferentes. MlCommons dice que estaba motivado para crearlo mediante un deseo de apoyar la I + D en “varias áreas de la tecnología del habla”.

“Apoyar la investigación más amplia del procesamiento del lenguaje natural para idiomas distintos del inglés ayuda a llevar tecnologías de comunicación a más personas a nivel mundial”, escribió la organización en una publicación de blog el jueves. “Anticipamos varias vías para que la comunidad de investigación continúe construyendo y desarrollándose, especialmente en las áreas de mejorar los modelos de voz de lenguaje de baja recursos, el reconocimiento de voz mejorado en diferentes acentos y dialectos, y nuevas aplicaciones en la síntesis del habla”.

Es un objetivo admirable, para estar seguro. Pero los conjuntos de datos de IA como el discurso de las personas no supervisado pueden llevar riesgos para los investigadores que eligen usarlos.

Los datos sesgados son uno de esos riesgos. Las grabaciones en el discurso de las personas sin supervisión vinieron de Archive.org, la organización sin fines de lucro quizás mejor conocida por la herramienta Wayback Machine Web Archival. Debido a que muchos de los contribuyentes de Archive.org son de habla inglesa, y estadounidense, casi todas las grabaciones en el discurso de las personas sin supervisión son de inglés con acento estadounidense, según el readme en la página oficial del proyecto.

Eso significa que, sin un filtrado cuidadoso, los sistemas de IA como el reconocimiento de voz y los modelos de sintetizador de voz capacitados en el habla de las personas sin supervisión podrían exhibir algunos de los mismos prejuicios. Podrían, por ejemplo, luchar por transcribir el inglés hablado por un hablante no nativo, o tener problemas para generar voces sintéticas en idiomas distintos del inglés.

El discurso de las personas sin supervisión también podría contener grabaciones de personas que no saben que sus voces se están utilizando para fines de investigación de IA, incluidas las aplicaciones comerciales. Si bien MlCommons dice que todas las grabaciones en el conjunto de datos son dominio público o están disponibles bajo las licencias de Creative Commons, existe la posibilidad de errores.

Según un análisis del MIT, cientos de conjuntos de datos de capacitación de IA disponibles públicamente carecen de información de licencias y contienen errores. Los defensores del creador, incluido Ed Newton-Rex, el CEO de la organización sin fines de lucro centrada en la ética de la IA, han argumentado bastante entrenado, han argumentado que los creadores no deberían estar obligados a “optar” de los conjuntos de datos de IA debido a la onerosa carga de la carga impone a estos creadores .

“Muchos creadores (por ejemplo, usuarios de Squarespace) no tienen una forma significativa de optar por no participar”, escribió Newton-Rex en una publicación sobre X en junio pasado. “Para los creadores que poder Opta, existen múltiples métodos de exclusión superpuestos, que son (1) increíblemente confusos y (2) lamentablemente incompletos en su cobertura. Incluso si existiera una opción universal perfecta, sería muy injusto poner la carga de exclusión a los creadores, dado que la IA generativa usa su trabajo para competir con ellos, muchos simplemente no se darían cuenta de que podrían optar por no participar “.

MlCommons dice que está comprometido a actualizar, mantener y mejorar la calidad del discurso de las personas sin supervisión. Pero dados los fallas potenciales, se les corresponde a los desarrolladores ejercer una grave precaución.

You may also like

Exploramos la red para colectar la información más importante que pueda ser compartida para los intereses de los internautas.

El Blog del Internauta 2022

-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00