Microsoft quiere llevar la IA generativa a la vanguardia de Windows y de las PC que la ejecutan.
En un par de conferencias magistrales durante su conferencia anual de desarrolladores Build esta semana, la compañía presentó una nueva línea de máquinas con Windows a la que llama PC Copilot+, además de funciones generativas impulsadas por IA como Recall, que ayuda a los usuarios a encontrar aplicaciones, archivos y otros contenidos que tienen. visto en el pasado. Copilot, la marca de IA generativa de Microsoft, pronto estará mucho más integrada en la experiencia de Windows 11. Y nuevos dispositivos Microsoft Surface están en camino.
Hemos reunido todos los anuncios importantes del lunes y martes aquí.
Aplicaciones volumétricas
Microsoft está incorporando aplicaciones volumétricas de Windows (básicamente aplicaciones de realidad virtual interactivas y con reconocimiento espacial) a los auriculares Meta Quest. A través de una asociación con Meta, Microsoft dice que entregará Windows 365 y conectividad de PC local a los auriculares Quest, lo que permitirá a los desarrolladores extender sus aplicaciones al espacio 3D.
Durante el discurso de apertura del martes, Microsoft mostró una vista digital en 3D de un controlador Xbox desde la perspectiva de un auricular Meta Quest 3, un objeto digital que el usuario puede manipular con sus manos. “Estamos profundizando nuestra asociación con Meta para hacer de Windows una experiencia de primera clase en los dispositivos Quest”, dijo durante la demostración Pavan Davuluri, vicepresidente ejecutivo de Windows y dispositivos de Microsoft.
Los desarrolladores pueden registrarse para obtener una vista previa y recibir acceso a la nueva API volumétrica de Microsoft.
PC copiloto+
Las PC Copilot+ son la visión de Microsoft del hardware insignia de Windows que da prioridad a la IA. Todos incluyen chips dedicados llamados NPU para impulsar experiencias de IA como Recall. Y se envían con 16 GB de RAM como mínimo, junto con almacenamiento SSD.
Las primeras PC Copilot+ incluirán los chips Snapdragon X Elite y Plus de Qualcomm, que según Microsoft ofrecen hasta 15 horas de navegación web y 20 horas de duración de la batería de vídeo. Los fabricantes de chips Intel y AMD también están comprometidos a fabricar procesadores para dispositivos Copilot+ en asociación con una variedad de fabricantes, incluidos Acer, Asus, Dell, HP, Lenovo y Samsung.
Las PC Copilot+ comienzan en $999 y algunas están disponibles para pedidos por adelantado hoy.
Surface Pro y portátil Surface
Los dispositivos Surface recientemente presentados por Microsoft, Surface Laptop y Surface Pro, se centran en el rendimiento y la batería.
La última Surface Laptop, disponible con una pantalla de 13,8 o 15 pulgadas, ha sido rediseñada con “líneas modernas” y marcos de pantalla más delgados. Dura hasta 22 horas con una carga y es hasta un 86% más rápido que el Surface Laptop 5, afirma la compañía. También es compatible con Wi-Fi 7 y tiene un panel táctil de retroalimentación háptica.
En cuanto al nuevo Surface Pro, Microsoft dice que es hasta un 90% más rápido que el Surface Pro de la generación anterior (Surface Pro 9) y tiene un nuevo OLED con pantalla HDR, Wi-Fi 7 (y 5G opcional) y un cámara frontal ultra ancha mejorada. Además, su teclado desmontable, reforzado con fibra de carbono adicional, ahora tiene retroalimentación háptica.
Recordar
La próxima función Recuperar de Windows 11 puede “recordar” aplicaciones y contenido al que un usuario accedió en su PC hace semanas o incluso meses, ayudándolo, por ejemplo, a encontrar un chat de Discord donde hablaban de la ropa que estaban considerando comprar. Los usuarios pueden usar la línea de tiempo de Recall para “retroceder” y ver en qué estuvieron trabajando en el pasado reciente y profundizar en archivos como presentaciones de PowerPoint para mostrar información potencialmente relevante para sus búsquedas.
Microsoft dice que Recall puede crear asociaciones entre colores, imágenes y más para permitir a los usuarios buscar prácticamente cualquier cosa en sus PC en lenguaje natural (no muy diferente a la tecnología de inicio Rewind); los desarrolladores podrán mejorar Recall agregando información contextual a sus aplicaciones. Y Microsoft afirma que todos los datos de usuario asociados con Recall se mantienen privados y en el dispositivo y, lo que es más importante, no se utilizan para entrenar modelos de IA.
Aquí hay más de Microsoft: “Tus instantáneas son tuyas; permanecen localmente en su PC. Puede eliminar instantáneas individuales, ajustar y eliminar rangos de tiempo en Configuración o pausar en cualquier momento directamente desde el ícono en la bandeja del sistema en su barra de tareas. También puede filtrar aplicaciones y sitios web para que nunca se guarden”.
Edición de imágenes y traducciones en vivo.
Ahora hay más IA en Windows que nunca y parte de ella exclusivamente en las nuevas PC Copilot+.
Una nueva característica llamada Super Resolución puede restaurar fotos antiguas ampliándolas automáticamente. Y Copilot ahora puede analizar imágenes para brindar a los usuarios ideas para composiciones creativas. A través de una función llamada Cocreator, los usuarios pueden generar imágenes y también pedirle al modelo de IA que siga lo que están dibujando para cambiar o cambiar el estilo de la imagen.
En otros lugares, Live Captions con traducción en vivo traduce cualquier audio que pasa a través de una PC, ya sea de YouTube o de un archivo local, al idioma que elija el usuario. Inicialmente, las traducciones en vivo admitirán alrededor de 40 idiomas, incluidos inglés, español, mandarín y ruso.
Una nueva característica separada pero relacionada en Microsoft Edge ofrece traducción de videos en tiempo real en sitios como LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg y más. Esta función, que estará disponible en un futuro próximo, admite la traducción de español a inglés y de inglés a alemán, hindi, italiano, ruso y español, traduce contenido hablado mediante doblaje y subtítulos en vivo.
Copiloto del equipo y extensiones.
Team Copilot es la última expansión del creciente conjunto de tecnología de inteligencia artificial generativa Copilot de Microsoft. Se integra con Teams, la aplicación de videoconferencia de la empresa, para ayudar a gestionar las agendas de las reuniones y tomar notas de las que cualquiera en una reunión puede ser coautor. Y se extiende a Loop y Planner, las plataformas de planificación y colaboración de Microsoft, para crear y asignar tareas, realizar un seguimiento de los plazos y notificar a los miembros del equipo cuando se necesitan sus aportaciones.
En noticias algo relacionadas con Copilot, Microsoft ha lanzado (en vista previa privada) Copilot Extensions, que permiten a los desarrolladores ampliar la herramienta de generación de código de GitHub, GitHub Copilot, con aplicaciones y habilidades de terceros. Los socios de lanzamiento incluyen DataStax, Docker y LambdaTest; Las extensiones vivirán en GitHub Marketplace, pero los desarrolladores también podrán crear sus propias extensiones privadas para integrarlas con sus sistemas internos y API.
Tiempo de ejecución del copiloto de Windows
Para potenciar capacidades como Recall y Super Resolution se encuentra Windows Copilot Runtime, una colección de ~40 modelos de IA generativa que conforman lo que Microsoft describe como “una nueva capa” de Windows. Junto con el índice semántico, un sistema basado en vectores local para una PC Copilot+ individual, Windows Copilot Runtime permite que aplicaciones generativas impulsadas por IA, incluidas aplicaciones de terceros, se ejecuten sin necesidad necesaria de una conexión a Internet.
“[The runtime] consta de API de IA listas para usar, como efectos de estudio, traducciones de subtítulos en vivo, OCR, recuperación con actividad del usuario y [more]que estará disponible para los desarrolladores en junio”, dijo Davuluri el martes.
Microsoft dice que CapCut, el popular editor de video del propietario de TikTok, ByteDance, utilizará Windows Copilot Runtime y la nueva biblioteca Windows Copilot, un conjunto de API y herramientas de desarrollo de IA, para acelerar sus funciones de IA. Y Meta agregará los efectos de estudio antes mencionados a WhatsApp para ofrecer funciones como desenfoque de fondo y contacto visual durante las videollamadas.
Constructores de bots actualizados
Azure AI Studio, el conjunto de herramientas dentro del servicio Azure OpenAI de Microsoft que permite a los clientes combinar un modelo de IA y crear una aplicación que “razona sobre” esos datos, pronto permitirá a los desarrolladores crear aplicaciones utilizando API de inferencia de pago por uso: las API a través del cual los desarrolladores pueden acceder y ajustar modelos de IA generativa alojados en la infraestructura de Azure. Microsoft llama a esto “modelo como servicio” y, para empezar, lo lanzará con modelos de Nixtla y Core42.
En el conjunto de productos adyacente Copilot Studio, Microsoft está lanzando agentes Copilot, que la compañía describe como robots de inteligencia artificial que pueden “orquestar de forma independiente tareas adaptadas a roles y funciones específicas”. (Copilot Studio proporciona herramientas para conectar Copilot para Microsoft 365, el “copilot” impulsado por IA en aplicaciones como Excel y Word, con datos de terceros). Aprovechando la memoria y el conocimiento del contexto, los agentes de Copilot pueden navegar por varios tipos de flujos de trabajo empresariales, aprender de los comentarios de los usuarios y pedir ayuda cuando se encuentran con situaciones que no saben cómo manejar.
Kit de desarrollo de Snapdragon
Hay un nuevo kit de desarrollo de Qualcomm dirigido a desarrolladores que crean aplicaciones para PC Copilot+ con chip Arm
El Snapdragon Dev Kit de $899.99 para Windows, que por cierto mide aproximadamente el mismo ancho, alto y largo que el Mac Mini de Apple, alberga el chip Snapdragon X Elite de Qualcomm combinado con 32 GB de RAM, 512 GB de almacenamiento y muchas E/S. El kit de desarrollo admite Wi-Fi 7 y Bluetooth 5.4 y, a través de sus diversos puertos USB-C y HDMI, puede controlar hasta tres monitores 4K a la vez.
fi-3
Microsoft anunció una incorporación a su familia de modelos de IA generativa Phi, Phi-3-vision, que puede realizar tareas de razonamiento y análisis visual general, como responder preguntas sobre gráficos e imágenes. El modelo puede leer tanto texto como imágenes y es lo suficientemente eficiente como para ejecutarse en un dispositivo móvil.
Phi-3-vision está disponible en versión preliminar, mientras que las contrapartes de solo texto del modelo anunciadas anteriormente (Phi-3-mini, Phi-3-small y Phi-3-medium) ahora están disponibles de forma general.
Asociación con la Academia Khan
Microsoft se está asociando con Khan Academy para donar acceso a la infraestructura informática en la nube, lo que permitirá a Khan Academy ofrecer a los educadores en los EE. UU. acceso gratuito a las herramientas impulsadas por IA de Khan Academy. Las dos compañías también colaborarán para explorar oportunidades para mejorar las aplicaciones de inteligencia artificial para tutorías de matemáticas a través de inteligencia artificial generativa, dijo Microsoft el martes.
¡Estamos lanzando un boletín informativo sobre IA! Inscribirse aquí para comenzar a recibirlo en sus bandejas de entrada el 5 de junio.