Microsoft lanza API de reconocimiento de voz local en Windows y modelos de lenguaje pequeño Aion
2026-06-04 16:19
Favoritos

es.wedoany.com Noticia: Del 2 al 3 de junio, Microsoft lanzó actualizaciones de Windows AI APIs durante Build 2026, incluyendo una nueva API de reconocimiento de voz local, y presentó dos modelos de lenguaje pequeño para ejecución local: Aion 1.0 Instruct y Aion 1.0 Plan. Estas capacidades están dirigidas principalmente a desarrolladores de Windows 11, permitiendo la conversión de voz a texto, procesamiento inteligente de texto y ejecución de tareas de agente local en PC.

Esta actualización traslada aún más las capacidades de procesamiento de lenguaje al lado del terminal. La nueva API de reconocimiento de voz admite la generación de transcripciones en tiempo real o por lotes desde micrófonos, flujos de audio y archivos de audio, y puede utilizarse para generación de subtítulos, entrada por dictado, aplicaciones de audio y video, y herramientas de accesibilidad. Microsoft enfatiza que, al ejecutarse localmente, esta capacidad puede generar transcripciones incluso sin conexión a Internet, reduciendo la dependencia de la inferencia en la nube. Para software empresarial, herramientas de reuniones, registros industriales en campo, operación remota y sistemas de capacitación educativa, el valor de la transcripción de voz local radica en reducir la latencia, disminuir los costos de llamadas a la nube, y permitir que los datos de voz sensibles se procesen localmente en el dispositivo. A medida que la IA ingresa en más entornos de oficina e industriales, el reconocimiento de voz está pasando de ser un módulo funcional independiente a una capacidad básica a nivel de sistema operativo.

Aion 1.0 Instruct está diseñado como un modelo de lenguaje pequeño para cargas de trabajo locales, capaz de admitir tareas inteligentes de texto como resúmenes, reformulación, reconocimiento de intenciones y accesibilidad.

Aion 1.0 Plan está orientado a escenarios de razonamiento de agente local, con un tamaño de modelo de 14 mil millones de parámetros, que admite una longitud de contexto de 32,000 y capacidades de llamada a herramientas, ayudando a las aplicaciones a comprender la intención del usuario, invocar herramientas, gestionar archivos y orquestar subagentes. Microsoft planea que este modelo se ejecute como parte de Windows en dispositivos que cumplan los requisitos, trasladando algunos flujos de agente de la nube al dispositivo local. Para los desarrolladores, esto significa que las aplicaciones de escritorio podrán invocar directamente capacidades de comprensión de texto, reconocimiento de voz y orquestación de herramientas a nivel de sistema operativo, sin necesidad de integrar servicios de modelos externos para cada aplicación. Para los departamentos de TI empresariales, los modelos locales también plantean nuevos problemas de gobernanza, incluidos permisos de modelo, límites de acceso a archivos, identificación de usuarios, retención de datos, rendimiento del dispositivo y auditoría entre aplicaciones. La adopción a gran escala en entornos empresariales dependerá de si las capacidades locales de IA y los mecanismos de gestión de seguridad maduran de manera sincronizada.

Microsoft también anunció que Windows AI APIs se expandirán a más PC con Windows 11, y que, además de NPU, algunas capacidades también serán compatibles con CPU y GPU. La API de reconocimiento de voz se centrará inicialmente en inglés, y luego se expandirá gradualmente a más mercados globales. Con la integración de modelos locales, reconocimiento de voz y capacidades de agente local en el ecosistema de desarrollo de Windows, la tecnología de procesamiento de lenguaje está pasando de ser una interfaz de servicio en la nube a una capa de sistema operativo terminal, convirtiéndose en un componente fundamental para el desarrollo de aplicaciones, la interacción accesible y los flujos de trabajo inteligentes empresariales.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com