Alibaba Qwen lanza el modelo multimodal Qwen3.5-Omni, que admite más de 10 horas de entrada de audio y reconoce 113 idiomas
2026-04-01 09:45
Favoritos

es.wedoany.com Noticia: El 30 de marzo, Alibaba Qwen anunció el lanzamiento oficial del modelo multimodal Qwen3.5-Omni, lo que marca un paso importante en el campo de la inteligencia artificial multimodal. La principal característica de este modelo es su potente capacidad de procesamiento multimodal, que le permite manejar simultáneamente texto, audio, vídeo y otras formas de información, ofreciendo a los usuarios una experiencia de interacción más inteligente y natural.

La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, para satisfacer las necesidades de rendimiento y eficiencia en diferentes escenarios de aplicación. En cuanto a la capacidad de procesamiento de contexto, el modelo admite contextos largos de hasta 256k, lo que le permite procesar eficientemente grandes volúmenes de información. Es especialmente destacable el rendimiento de Qwen3.5-Omni en el procesamiento de audio y vídeo: el modelo admite entradas de audio de más de 10 horas y entradas de audio/vídeo de más de 400 segundos en 720p (1 FPS), lo que le otorga una ventaja significativa en tareas complejas como el reconocimiento de voz o la comprensión de vídeo.

En cuanto al soporte de idiomas, Qwen3.5-Omni demuestra una amplia capacidad de cobertura lingüística, admitiendo el reconocimiento de voz en 113 idiomas y dialectos, así como la generación de voz en 36 idiomas y dialectos. Esta característica dota al modelo de una potente capacidad de adaptación para escenarios de aplicación global, pudiendo utilizarse ampliamente en servicios para empresas multinacionales, creación de contenido multilingüe, atención al cliente inteligente, etc. Actualmente, los desarrolladores pueden probar e integrar Qwen3.5-Omni a través de dos métodos: Offline API y Realtime API, satisfaciendo de forma flexible las diferentes necesidades de procesamiento por lotes sin conexión e interacción en tiempo real.

Expertos del sector señalan que el modelo multimodal Qwen3.5-Omni lanzado por Alibaba Qwen no solo logra varios avances en parámetros técnicos, sino que también refleja la tendencia evolutiva de los grandes modelos, que pasan del procesamiento de texto único a la fusión multimodal. Con la mejora continua de las capacidades multimodales, modelos como Qwen3.5-Omni tienen el potencial de impulsar nuevas formas de aplicación en múltiples industrias como hardware inteligente, educación, salud, entretenimiento, etc., promoviendo aún más la popularización y aplicación práctica de la tecnología de inteligencia artificial.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com

Recomendaciones
El consorcio liderado por Telefónica en España prevé presentar la oferta final para la superfábrica de IA entre junio y julio, con una inversión total que podría superar los 4.000 millones de euros
2026-05-16
Inter Venezuela de Venezuela adopta la solución de Harmonic de EE. UU. para desplegar servicios de retorno móvil XGS-PON a nivel nacional
2026-05-16
La Casa Blanca publica la lista de líderes empresariales que acompañarán a Trump en su visita a China
2026-05-14
Google de EE. UU. negocia con SpaceX la colaboración en el lanzamiento de centros de datos orbitales para hacer frente a las limitaciones de recursos de computación terrestres
2026-05-14
OpenAI de EE. UU. lanza tres modelos de audio de la serie GPT-Realtime, integrando por primera vez el razonamiento de nivel GPT-5 en la interacción por voz
2026-05-14
ClickUp de EE. UU. lanza la actualización del asistente de IA Brain 2.0, capaz de ejecutar flujos de trabajo complejos de forma autónoma
2026-05-14
OTT Cybersecurity de EAU publica el Protocolo de Confianza para Agentes de IA ATP, que se presentará ante el IETF como estándar abierto
2026-05-13
Intel y NVIDIA reafirman su colaboración y planean desarrollar nuevos productos con gráficos integrados y procesadores
2026-05-13
Jia Yueting asume el cargo de CEO Global de Faraday Future en EE. UU., FF se transforma en una empresa estadounidense de ecosistema de IA física
2026-05-13
Lunar Outpost de EE. UU. obtiene 30 millones de dólares en financiación Serie B para acelerar el despliegue de infraestructura espacial
2026-05-13