es.wedoany.com Noticia: SoundWise.ai ha anunciado recientemente el lanzamiento de una herramienta de transcripción por inteligencia artificial gratuita y permanente. Esta plataforma basada en navegador convierte audio y video en texto en más de 98 idiomas, sin cobrar por minuto a usuarios individuales ni imponer un límite general de uso.
La plataforma emplea una arquitectura de doble motor, que incluye un modelo de transcripción por IA gratuito dentro del navegador que se ejecuta localmente en el dispositivo del usuario, y una capa de mejora en la nube opcional, SoundWise Pro. Esta última ofrece una precisión cercana al nivel humano, con una velocidad hasta 10 veces superior a la transcripción en tiempo real. Ambos motores cubren conjuntamente flujos de trabajo de voz a texto, desde notas rápidas de podcasts hasta procesos profesionales en redacciones, aulas y equipos de contenido.
Eric, CEO de SoundWise, afirmó que el contenido de audio y video debería ser tan fácil de buscar, editar, citar, traducir y reutilizar como cualquier otro documento. El equipo creó SoundWise para gestionar el trabajo posterior a la grabación, incluyendo la conversión de entrevistas en artículos, de conferencias en notas de estudio, de seminarios web en activos de marketing, y de material bruto en texto utilizable para el equipo.
La herramienta ofrece funciones de transcripción por IA local gratuita, ilimitada y permanente. Los usuarios pueden transcribir archivos de audio y video directamente en el navegador, sin cobro por minuto para uso personal razonable y sin límites generales de transcripción. Dado que el procesamiento se realiza localmente, las grabaciones sensibles no abandonan el dispositivo del usuario. SoundWise Pro enruta los archivos a través de modelos optimizados en la nube; según pruebas internas, una grabación de una hora puede transcribirse en aproximadamente 30 segundos, unas 120 veces la velocidad en tiempo real. La plataforma maneja tareas de voz a texto multilingüe que abarcan inglés, español, chino mandarín, francés, alemán, japonés, coreano, árabe, portugués, ruso y otros más de 88 idiomas. Los tipos de archivo compatibles incluyen MP3, WAV, FLAC, AAC, M4A, MP4, MOV, MKV y otros formatos multimedia comunes. La herramienta de revisión de transcripciones integrada ofrece detección automática de hablantes y marcas de tiempo palabra por palabra; el contenido transcrito se puede exportar en formatos TXT y PDF, y próximamente se añadirán exportaciones en DOCX y subtítulos SRT.
SoundWise Free ofrece conversiones ilimitadas de audio a texto y video a texto, sin cobro por minuto, sin necesidad de tarjeta de crédito ni registro detrás de un muro de pago. Los archivos se procesan localmente mediante el modelo de IA dentro del navegador. Según pruebas internas, el tiempo medio de procesamiento para una grabación de una hora es de aproximadamente 10 minutos, dependiendo del rendimiento del dispositivo y la complejidad del archivo. Este enfoque local está diseñado específicamente para estudiantes, creadores independientes, investigadores académicos y profesionales preocupados por la privacidad que manejan contenido grabado con frecuencia pero no necesitan almacenamiento en la nube ni procesamiento en segundo plano.
Para usuarios que requieren velocidad y escala, SoundWise Pro traslada la transcripción a GPU en la nube, que continúa funcionando incluso después de cerrar el navegador. Los archivos de audio de una hora se completan en aproximadamente 30 segundos. Los planes incluyen transcripciones ilimitadas en la nube, almacenamiento ilimitado en la nube, exportación en múltiples formatos y acceso anticipado a funciones próximas como subtítulos SRT y exportación DOCX. SoundWise Pro tiene un precio de 20 dólares al mes, o 10 dólares al mes con pago anual.
SoundWise está diseñado para integrarse en el flujo de trabajo de conversión de contenido oral en activos escritos. Los creadores de contenido y productores de podcasts pueden transcribir videos y audio en subtítulos, publicaciones de blog, boletines informativos y publicaciones en redes sociales en cuestión de minutos. Los equipos de marketing y crecimiento pueden convertir seminarios web, llamadas de ventas, entrevistas con clientes y episodios de podcasts en bases de conocimiento buscables y textos editables. Educadores y estudiantes pueden apoyarse en la transcripción de conferencias para transformar clases y talleres en guías de estudio, tarjetas didácticas y notas de repaso. Periodistas e investigadores cualitativos pueden procesar entrevistas y grabaciones de campo, incluyendo etiquetas de hablantes y marcas de tiempo, sin necesidad de reproducir todo el fragmento.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









