Deepgram, en colaboración con Fortanix y NVIDIA, orienta la IA de voz local hacia el despliegue de computación confidencial
2026-06-03 17:36
Favoritos

es.wedoany.com Noticia: Recientemente, la empresa estadounidense de infraestructura de IA de voz en tiempo real Deepgram se ha asociado con la empresa de seguridad de datos Fortanix. Aprovechando Fortanix Confidential AI y las capacidades de computación confidencial de NVIDIA, ofrecerán soluciones de despliegue de IA de voz que pueden ejecutarse en entornos locales para industrias reguladas. Esta solución está dirigida a escenarios como la atención médica, las finanzas, el gobierno, el servicio al cliente empresarial y las operaciones internas, centrándose en proteger la seguridad de los datos de voz y los pesos de los modelos durante el proceso de inferencia.

Esta colaboración lleva la competencia en IA de voz más allá de la precisión del reconocimiento, la baja latencia y las capacidades multilingües, adentrándose en la cuestión de si se puede acceder a entornos empresariales altamente sensibles. En muchas industrias, los datos de voz contienen una gran cantidad de privacidad y secretos comerciales, como conversaciones médico-paciente, registros de transacciones financieras, información de identidad del cliente, contenido de reuniones empresariales, procesos de gestión de tickets y solicitudes de servicio interno. Aunque las soluciones tradicionales de reconocimiento de voz o agentes de voz en la nube son fáciles de implementar rápidamente, a menudo encuentran limitaciones en cuanto a residencia de datos, auditoría de cumplimiento, protección de la propiedad intelectual de los modelos y límites de seguridad interna. Deepgram adopta una ruta de despliegue local, permitiendo a las empresas ejecutar capacidades de reconocimiento de voz, síntesis de voz y voz a voz en su propio entorno; Fortanix, a través de su tecnología de IA confidencial y entornos de ejecución confiables, proporciona protección de aislamiento a nivel de hardware para los datos de audio y los pesos de los modelos que se están procesando, reduciendo el riesgo de robo de modelos, acceso no autorizado a datos o exposición del proceso de inferencia a la infraestructura subyacente.

La solución se ejecuta sobre GPU compatibles con la computación confidencial de NVIDIA, donde los datos de audio y los pesos de los modelos de IA permanecen cifrados y aislados durante la fase de procesamiento activo. Deepgram, Fortanix y NVIDIA posicionan esta combinación como una pila tecnológica preintegrada para entornos de alta seguridad.

La voz se está convirtiendo en la nueva puerta de entrada a los sistemas empresariales. En el pasado, la grabación de centros de llamadas, las actas de reuniones, el control de calidad del servicio al cliente y la transcripción de voz eran más procesos posteriores al tratamiento, donde las empresas subían el audio a un proveedor de servicios para obtener texto, resúmenes o resultados de análisis. Con la entrada de los agentes de voz en tiempo real en el servicio al cliente, los registros médicos, el mantenimiento en campo, los servicios de asistencia técnica de TI y los procesos de revisión de cumplimiento, los datos de voz participan directamente en la toma de decisiones empresariales y la ejecución automatizada. Los requisitos de seguridad se han extendido desde "cifrado en reposo y en tránsito" a "protección durante el uso". La incorporación de la computación confidencial resuelve un punto crítico en el despliegue de producción de la IA de voz: los modelos y los datos también necesitan aislamiento cuando se ejecutan dentro de la GPU, y los administradores de la plataforma, el sistema operativo subyacente y el entorno de infraestructura no deben tener acceso directo a los datos en texto plano o a los activos del modelo. Para las empresas reguladas, esta capacidad ayuda a ejecutar aplicaciones de voz en tiempo real dentro de sus propios límites de seguridad, manteniendo al mismo tiempo una experiencia de interacción de baja latencia.

Deepgram ofrece capacidades de voz a texto, texto a voz y voz a voz, y admite modos de despliegue como API en la nube, autoalojamiento y API local. La empresa afirma que más de 200,000 desarrolladores y 1,400 organizaciones ya utilizan su plataforma, habiendo procesado más de 50,000 años de audio y transcrito más de 1 billón de palabras. Con esta asociación con Fortanix y NVIDIA, Deepgram puede llevar sus capacidades de IA de voz, originalmente más orientadas a desarrolladores y clientes de plataforma, a hospitales, bancos, aseguradoras, el sector público, servicios internos empresariales y clientes industriales con altos requisitos de soberanía de datos. El papel de Fortanix se centra en proteger la seguridad de todo el ciclo de vida de los datos, los modelos de IA y las aplicaciones en entornos locales, multinube y de alta seguridad, especialmente conectando la computación confidencial, el control de claves, la ejecución de confianza cero y la protección de modelos.

Las variables futuras se centran en el costo real de implementación para las empresas, la disponibilidad de entornos de computación confidencial en GPU, la adaptación a la auditoría de cumplimiento y el grado de replicabilidad de los agentes de voz en los procesos industriales. Si esta solución logra establecer casos estables en industrias reguladas, el modo de despliegue de la IA de voz pasará de una "prioridad de llamada en la nube" a una arquitectura híbrida de "ejecución local, modelos protegidos y datos sin salir de los límites". Para las empresas de reconocimiento de voz e IA conversacional, el enfoque competitivo futuro recaerá simultáneamente en el rendimiento del modelo, la capacidad en tiempo real, la entrega privada, la integración de computación confidencial y las capacidades de cumplimiento normativo de la industria.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com