Mantenerse al día con una industria que evoluciona tan rápidamente como la IA es una tarea difícil. Entonces, hasta que una IA pueda hacerlo por usted, aquí hay un resumen útil de historias recientes en el mundo del aprendizaje automático, junto con investigaciones y experimentos notables que no cubrimos por sí solos.
Por cierto, TechCrunch planea lanzar pronto un boletín informativo sobre IA. Manténganse al tanto. Mientras tanto, estamos aumentando la cadencia de nuestra columna semiregular de IA, que anteriormente era dos veces al mes (más o menos), a semanal; así que esté atento a más ediciones.
Esta semana en IA, OpenAI anunció que llegó a un acuerdo con News Corp, el nuevo gigante editorial, para entrenar modelos de IA generativa desarrollados por OpenAI en artículos de marcas de News Corp, incluidos El periodico de Wall Street, Tiempos financieros y Vigilancia del mercado. El acuerdo, que las empresas describen como “plurianual” e “histórico”, también otorga a OpenAI el derecho de mostrar cabeceras de News Corp dentro de aplicaciones como ChatGPT en respuesta a ciertas preguntas, presumiblemente en los casos en que las respuestas provienen total o parcialmente. de publicaciones de News Corp.
Suena como una victoria para ambas partes, ¿no? News Corp recibe una inyección de dinero en efectivo por su contenido (más de 250 millones de dólares, según se informa) en un momento en que el panorama de la industria de los medios es aún más sombrío de lo habitual. (La IA generativa no ha ayudado, amenazando con reducir en gran medida el tráfico de referencias de las publicaciones). Mientras tanto, OpenAI, que está luchando contra los titulares de derechos de autor en varios frentes por disputas de uso legítimo, tiene una batalla judicial menos costosa de la que preocuparse.
Pero el diablo está en los detalles. Tenga en cuenta que el acuerdo de News Corp tiene una fecha de finalización, al igual que todos los acuerdos de licencia de contenido de OpenAI.
Eso en sí mismo no es mala fe por parte de OpenAI. La concesión de licencias a perpetuidad es una rareza en los medios, dadas las motivaciones de todas las partes involucradas para mantener la puerta abierta a la renegociación del acuerdo. De todos modos, eso es un poco sospechoso a la luz de los recientes comentarios del CEO de OpenAI, Sam Altman, sobre la importancia cada vez menor de los datos de entrenamiento del modelo de IA.
En una aparición en el podcast “All-In”, Altman dijo que “definitivamente [doesn’t] Creo que habrá una carrera armamentista [training] datos” porque “cuando los modelos se vuelven lo suficientemente inteligentes, en algún momento, no debería tratarse de más datos, al menos no para el entrenamiento”. Por otra parte, le dijo a James O’Donnell, de MIT Technology Review, que es “optimista” en cuanto a que OpenAI (y/o la industria de la IA en general) “encontrará una salida a este problema”. [needing] Cada vez hay más datos de entrenamiento”.
Los modelos aún no son tan “inteligentes”, lo que llevó a OpenAI a experimentar con datos de entrenamiento sintéticos y a explorar los confines de la web (y YouTube) en busca de fuentes orgánicas. Pero supongamos que algún día no Necesitamos muchos datos adicionales para mejorar a pasos agigantados. ¿Dónde deja eso a los editores, especialmente una vez que OpenAI ha eliminado todos sus archivos?
El punto al que me refiero es que los editores (y los otros propietarios de contenido con los que trabajó OpenAI) parecen ser socios de conveniencia a corto plazo, no mucho más. A través de acuerdos de licencia, OpenAI neutraliza efectivamente una amenaza legal (al menos hasta que los tribunales determinen cómo se aplica el uso legítimo en el contexto del entrenamiento de IA) y puede celebrar una victoria de relaciones públicas. Los editores obtienen el capital que tanto necesitan. Y continúa el trabajo sobre la IA que podría perjudicar gravemente a esos editores.
Aquí hay algunas otras historias destacadas de IA de los últimos días:
- DJ con IA de Spotify: La incorporación de Spotify de su función AI DJ, que presenta selecciones de canciones personalizadas a los usuarios, fue el primer paso de la compañía hacia un futuro de IA. Ahora, Spotify está desarrollando una versión alternativa de ese DJ que hablará español, escribe Sarah.
- Consejo de IA de Meta: Meta anunció el miércoles la creación de un consejo asesor de IA. Sin embargo, hay un gran problema: solo hay hombres blancos. Esto parece un poco sordo considerando que los grupos marginados son los que tienen más probabilidades de sufrir las consecuencias de las deficiencias de la tecnología de inteligencia artificial.
- La FCC propone divulgaciones de IA: La Comisión Federal de Comunicaciones (FCC) ha planteado el requisito de que el contenido generado por IA se divulgue en anuncios políticos, pero no se prohíba. Devin tiene la historia completa.
- Responder llamadas con tu voz: Truecaller, el conocido servicio de identificación de llamadas, pronto permitirá a los clientes utilizar su asistente con tecnología de inteligencia artificial para responder llamadas telefónicas en su propio voz, gracias a una asociación recientemente firmada con Microsoft.
- Humane considera una venta: Humane, la compañía detrás del tan publicitado Ai Pin que se lanzó con críticas poco entusiastas el mes pasado, está buscando un comprador. Según se informa, la empresa se ha valorado entre 750 millones y 1.000 millones de dólares, y el proceso de venta se encuentra en las primeras etapas.
- TikTok recurre a la IA generativa: TikTok es la última empresa de tecnología en incorporar IA generativa en su negocio publicitario, ya que la compañía anunció el martes que lanzará una nueva suite TikTok Symphony AI para marcas. Las herramientas ayudarán a los especialistas en marketing a escribir guiones, producir vídeos y mejorar sus activos publicitarios actuales, informa Aisha.
- Cumbre de IA de Seúl: En una cumbre sobre seguridad de la IA celebrada en Seúl, Corea del Sur, funcionarios gubernamentales y ejecutivos de la industria de la IA acordaron aplicar medidas de seguridad elementales en este campo en rápida evolución y establecer una red internacional de investigación de seguridad.
- PC con IA de Microsoft: En un par de conferencias magistrales durante su conferencia anual de desarrolladores Build esta semana, Microsoft reveló una nueva línea de máquinas Windows (y portátiles Surface) a la que llama PC Copilot+, además de funciones generativas impulsadas por IA como Recall, que ayuda a los usuarios a encontrar aplicaciones, archivos y otros contenido que han visto en el pasado.
- La debacle de la voz de OpenAI: OpenAI está eliminando una de las voces de la función de texto a voz de ChatGPT. Los usuarios encontraron que la voz, llamada Sky, era inquietantemente similar a Scarlett Johansson (que interpretó personajes de IA antes), y la propia Johansson emitió un comunicado diciendo que contrató a un asesor legal para preguntar sobre la voz de Sky y obtener detalles exactos sobre cómo se desarrolló. .
- Ley de conducción autónoma del Reino Unido: Las regulaciones del Reino Unido para los vehículos autónomos ahora son oficiales después de recibir el consentimiento real, el sello final por el que cualquier legislación debe pasar antes de convertirse en ley.
Más aprendizajes automáticos
Algunas piezas interesantes de investigación adyacente a la IA para usted esta semana. El prolífico investigador de la Universidad de Washington, Shyan Gollakota, ataca de nuevo con un par de auriculares con cancelación de ruido que puedes solicitar para bloquear todo menos la persona que te gustaría escuchar. Mientras usa los auriculares, presiona un botón mientras mira a la persona y muestrea la voz que proviene de esa dirección específica, usándola para alimentar un motor de exclusión auditiva para filtrar el ruido de fondo y otras voces.
Los investigadores, dirigidos por Gollakota y varios estudiantes de posgrado, denominan al sistema Target Speech Hearing y lo presentaron la semana pasada en una conferencia en Honolulu. Útil como herramienta de accesibilidad y como opción cotidiana, esta es definitivamente una característica que una de las grandes empresas de tecnología puede robar para la próxima generación de latas de alta gama.
Los químicos de la EPFL están claramente cansados de realizar 18 tareas en particular, porque han entrenado un modelo llamado ChemCrow para realizarlas. No cosas de la vida real como valorar y pipetear, sino trabajos de planificación como examinar literatura y planificar cadenas de reacción. ChemCrow no sólo lo hace todo por los investigadores, por supuesto, sino que actúa más como una interfaz de lenguaje natural para todo el conjunto, utilizando cualquier opción de búsqueda o cálculo según sea necesario.
El autor principal del artículo que muestra ChemCrow dijo que es “análogo a un experto humano con acceso a una calculadora y bases de datos”, en otras palabras, un estudiante de posgrado, por lo que con suerte pueden trabajar en algo más importante o saltarse las partes aburridas. Me recuerda un poco a Coscientist. En cuanto al nombre, es “porque se sabe que los cuervos usan bien las herramientas”. ¡Suficientemente bueno!
Los robóticos de Disney Research están trabajando arduamente para que sus creaciones se muevan de manera más realista sin tener que animar manualmente todas las posibilidades de movimiento. Un nuevo artículo que presentarán en SIGGRAPH en julio muestra una combinación de animación generada por procedimientos con una interfaz de artista para modificarla, todo trabajando en un robot bípedo real (un Groot).
La idea es que puedes dejar que el artista cree un tipo de locomoción (rebotante, rígida, inestable) y los ingenieros no tienen que implementar cada detalle, solo asegurarse de que esté dentro de ciertos parámetros. Luego se puede realizar sobre la marcha, y el sistema propuesto esencialmente improvisa los movimientos exactos. Espere ver esto dentro de unos años en Disney World…