es.wedoany.com Noticia: El 30 de marzo, Alibaba Qwen anunció el lanzamiento oficial del modelo multimodal Qwen3.5-Omni, lo que marca un paso importante en el campo de la inteligencia artificial multimodal. La principal característica de este modelo es su potente capacidad de procesamiento multimodal, que le permite manejar simultáneamente texto, audio, vídeo y otras formas de información, ofreciendo a los usuarios una experiencia de interacción más inteligente y natural.
La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, para satisfacer las necesidades de rendimiento y eficiencia en diferentes escenarios de aplicación. En cuanto a la capacidad de procesamiento de contexto, el modelo admite contextos largos de hasta 256k, lo que le permite procesar eficientemente grandes volúmenes de información. Es especialmente destacable el rendimiento de Qwen3.5-Omni en el procesamiento de audio y vídeo: el modelo admite entradas de audio de más de 10 horas y entradas de audio/vídeo de más de 400 segundos en 720p (1 FPS), lo que le otorga una ventaja significativa en tareas complejas como el reconocimiento de voz o la comprensión de vídeo.
En cuanto al soporte de idiomas, Qwen3.5-Omni demuestra una amplia capacidad de cobertura lingüística, admitiendo el reconocimiento de voz en 113 idiomas y dialectos, así como la generación de voz en 36 idiomas y dialectos. Esta característica dota al modelo de una potente capacidad de adaptación para escenarios de aplicación global, pudiendo utilizarse ampliamente en servicios para empresas multinacionales, creación de contenido multilingüe, atención al cliente inteligente, etc. Actualmente, los desarrolladores pueden probar e integrar Qwen3.5-Omni a través de dos métodos: Offline API y Realtime API, satisfaciendo de forma flexible las diferentes necesidades de procesamiento por lotes sin conexión e interacción en tiempo real.
Expertos del sector señalan que el modelo multimodal Qwen3.5-Omni lanzado por Alibaba Qwen no solo logra varios avances en parámetros técnicos, sino que también refleja la tendencia evolutiva de los grandes modelos, que pasan del procesamiento de texto único a la fusión multimodal. Con la mejora continua de las capacidades multimodales, modelos como Qwen3.5-Omni tienen el potencial de impulsar nuevas formas de aplicación en múltiples industrias como hardware inteligente, educación, salud, entretenimiento, etc., promoviendo aún más la popularización y aplicación práctica de la tecnología de inteligencia artificial.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com








