Nvidia lanza Nemotron 3 Ultra en EE. UU., modelo abierto dirigido a reducir costos en agentes de tareas largas Noticias Globales

Nvidia lanza Nemotron 3 Ultra en EE. UU., modelo abierto dirigido a reducir costos en agentes de tareas largas

2026-06-02 09:16

Favoritos

es.wedoany.com Noticia: El 1 de junio, el CEO de Nvidia, Jensen Huang, presentó el nuevo modelo de IA Nemotron 3 Ultra durante un evento relacionado con COMPUTEX 2026 en Taipéi, Taiwán, China. Este modelo está orientado a flujos de trabajo de agentes empresariales, cubriendo escenarios como código, investigación, automatización de procesos empresariales y ejecución de tareas prolongadas.

Con el lanzamiento de Nemotron 3 Ultra, el rol de Nvidia continúa expandiéndose de proveedor de chips de IA a una combinación de "plataforma de cómputo + modelo + herramientas de desarrollo". Según información pública, Nemotron 3 Ultra es un modelo de expertos mixtos con 550 mil millones de parámetros, diseñado para agentes de tareas largas, logrando mayor velocidad de inferencia en tareas complejas de agentes y reduciendo costos operativos. Para los clientes empresariales, la presión de costos de las aplicaciones de agentes no proviene solo de consultas individuales, sino de la invocación continua de herramientas, lectura de datos empresariales, ejecución de planes de múltiples pasos, verificación repetida de resultados e inferencia de contexto largo. Si el modelo no puede mantener estabilidad y eficiencia en tareas largas, las empresas difícilmente podrán llevar a los agentes de pruebas internas a sistemas de producción. Al enfatizar la velocidad de inferencia, el costo y la capacidad de tareas largas en Nemotron 3 Ultra, Nvidia responde a la nueva demanda empresarial de IA que pasa de "poder generar contenido" a "poder ejecutar procesos".

Este modelo pertenece a la familia de modelos abiertos Nemotron 3. Anteriormente, Nvidia había lanzado modelos de diferentes escalas como Nano, Super y Ultra, orientados respectivamente a implementación ligera, inferencia de alto rendimiento y tareas complejas de agentes.

Desde una perspectiva técnica, Nemotron 3 Ultra continúa la estrategia combinada de Nvidia en torno a modelos abiertos, NVIDIA NIM, NeMo, CUDA-X y el ecosistema de software empresarial. Al implementar agentes, las empresas generalmente necesitan que el modelo posea múltiples capacidades como razonamiento, generación de código, invocación de herramientas, planificación de procesos, verificación de resultados y control de seguridad, además de adaptarse a nubes privadas, centros de datos locales, software industrial y sistemas de permisos empresariales. La ventaja de Nvidia no solo radica en el modelo en sí, sino en que su GPU, servicios de inferencia, bibliotecas de software y ecosistema de desarrolladores pueden formar una ruta de entrega unificada. Si Nemotron 3 Ultra puede integrarse con la infraestructura de IA existente, ayudará a las empresas a incorporar aplicaciones de agentes en procesos como ciberseguridad, toma de decisiones operativas, colaboración en I+D, servicio al cliente, automatización de TI y análisis de datos, reduciendo los costos de ingeniería de adaptar por separado diferentes modelos y marcos de inferencia.

Este lanzamiento también se alinea con la expansión de Nvidia en PC de IA, IA física y agentes empresariales. En la misma etapa, Jensen Huang también presentó novedades sobre chips para PC, kits de herramientas para agentes y modelos relacionados con robótica, mostrando que Nvidia está extendiendo las capacidades de IA desde los centros de datos hasta terminales personales, escritorios empresariales, robots y conducción autónoma, entre otros escenarios más amplios. Nemotron 3 Ultra asume el rol de complementar capacidades a nivel de agentes empresariales y modelos abiertos, formando junto con chips de hardware, plataformas de inferencia y herramientas de desarrollo la infraestructura de Nvidia para la próxima fase de aplicaciones de IA. Las variables futuras se centran en el grado de apertura del modelo, el costo real de inferencia, la estabilidad en tareas largas, la velocidad de integración con software empresarial y si los desarrolladores estarán dispuestos a construir aplicaciones de agentes especializadas en torno al ecosistema Nemotron.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com