Tencent Cloud de China se asocia con Soniox de EE. UU. para integrar la transcripción de voz en tiempo real en la infraestructura de comunicaciones global
2026-06-02 15:55
Favoritos

es.wedoany.com Noticia: Recientemente, Tencent Cloud de China ha alcanzado una cooperación estratégica con Soniox, una empresa de inteligencia artificial de voz con sede en San Francisco, EE. UU., integrando la tecnología de transcripción de voz de Soniox en la infraestructura global de comunicaciones de Tencent Cloud Real-Time Communication (TRTC). Esta colaboración ofrece capacidades de desarrollo de aplicaciones de voz en tiempo real multilingües y de baja latencia para escenarios empresariales como atención al cliente inteligente, asistentes de voz, traducción en tiempo real y transcripción de reuniones.

Esta colaboración se centra en la intersección de "procesamiento del lenguaje + comunicación en tiempo real", con el objetivo principal de reducir la barrera para que las empresas implementen aplicaciones globales de inteligencia artificial de voz. Soniox ofrece capacidades de reconocimiento de voz de alta precisión y baja latencia, que admiten más de 60 idiomas y pueden manejar escenarios de cambio de idioma dentro de una misma oración; Tencent Cloud TRTC proporciona una red de comunicación en tiempo real de nivel empresarial, que cubre más de 3200 nodos globales, con una latencia global inferior a 300 milisegundos, reducción de ruido por IA y resistencia a redes débiles. Al combinar ambos, los desarrolladores pueden integrar directamente la interfaz de transcripción de voz de Soniox en la consola de Tencent Cloud para construir aplicaciones de inteligencia artificial de voz para múltiples mercados. Para empresas de comercio electrónico transfronterizo, educación en línea, reuniones remotas, colaboración empresarial, juegos sociales, atención al cliente financiera y empresas SaaS internacionales, las aplicaciones de voz solían enfrentar tres problemas principales: primero, la gran diferencia en la calidad de la red entre países, lo que provoca retrasos y pérdida de paquetes en la transmisión de voz en tiempo real; segundo, el reconocimiento multilingüe requiere adaptar diferentes modelos e interfaces, lo que aumenta los costos de desarrollo y mantenimiento; tercero, escenarios como atención al cliente, traducción y actas de reuniones exigen alta precisión y velocidad de respuesta, y confiar únicamente en modelos de reconocimiento de voz o en enlaces de comunicación no puede garantizar una experiencia estable. Con esta colaboración, Tencent Cloud y Soniox colocan la red de comunicación en tiempo real y la tecnología de transcripción de voz en un mismo flujo de entrega, lo que ayuda a las empresas a integrar la entrada, transmisión, reconocimiento, salida de texto y procesamiento posterior de IA de la voz en una infraestructura de voz en tiempo real más completa, en lugar de ensamblar por separado servicios de comunicación, reconocimiento de voz y módulos de procesamiento multilingüe.

Esta colaboración permite a las empresas desarrollar aplicaciones de voz para el mercado de habla inglesa, así como para mercados multilingües como árabe, hindi y malayo, con aplicaciones que incluyen atención al cliente inteligente, asistentes de voz, traducción en tiempo real y transcripción de reuniones.

La inteligencia artificial de voz empresarial está pasando de ser una función puntual a una etapa de implementación a nivel de producción. En el pasado, la transcripción de voz se utilizaba principalmente para actas de reuniones, generación de subtítulos o grabación de atención al cliente, con métodos de procesamiento basados en transcripción fuera de línea y reconocimiento de un solo idioma; con la popularización de la IA generativa, los robots de atención al cliente en tiempo real, la colaboración transfronteriza y el hardware inteligente, la voz se está convirtiendo en una entrada importante para las aplicaciones empresariales. Los factores que realmente afectan la implementación no solo incluyen si el modelo de reconocimiento puede entender una oración, sino también la calidad del enlace de voz desde el usuario hasta la nube, la velocidad de retorno de los resultados de reconocimiento, la estabilidad en entornos de red débiles, la capacidad de reconocimiento continuo en escenarios de mezcla de idiomas, y la capacidad de conectarse sin problemas con modelos grandes, bases de conocimiento, sistemas de tickets y sistemas de traducción. Tencent Cloud TRTC proporciona nodos globales y capacidades de baja latencia en la capa de transmisión de audio y video en tiempo real, mientras que Soniox ofrece reconocimiento multilingüe y procesamiento de cambio de idioma en la misma oración en la capa de transcripción de voz. Al combinar ambos, las empresas pueden integrar más rápidamente la entrada de voz en centros de atención al cliente, reuniones en línea, transmisiones en vivo transfronterizas, capacitación remota y aplicaciones móviles. Para la industria de la información y las comunicaciones, esta colaboración también demuestra que las plataformas de comunicación en tiempo real están evolucionando de herramientas de llamadas de audio y video a canales subyacentes para servicios de inteligencia artificial de voz, traducción, colaboración y automatización. En el futuro, quien pueda organizar el enlace de comunicación, el reconocimiento de voz, el procesamiento multilingüe y las aplicaciones de IA en una plataforma unificada, tendrá más facilidad para atender las necesidades de implementación global y operación de usuarios multilingües de las empresas.

Las variables futuras de esta colaboración se centran en la velocidad de adopción por parte de los clientes empresariales, la estabilidad del reconocimiento multilingüe en entornos de ruido real, la coordinación de interfaces con aplicaciones de modelos grandes y los requisitos de cumplimiento de datos en diferentes países y regiones. A medida que más empresas expandan sus servicios de atención al cliente, reuniones, capacitación y actividades de marketing a nivel global, la transcripción de voz en tiempo real dejará de ser solo una función auxiliar para convertirse en una capacidad básica importante para la comunicación entre idiomas, los servicios automatizados y la operación inteligente. La colaboración entre Tencent Cloud y Soniox ofrece un nuevo ejemplo de combinación de productos para proveedores de servicios en la nube de China y empresas de inteligencia artificial de voz de EE. UU. en el mercado global de comunicaciones empresariales.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com