Nvidia lanza Nemotron 3 Ultra en EE. UU., modelo abierto dirigido a reducir costos en agentes de tareas largas
2026-06-02 09:16
Favoritos

es.wedoany.com Noticia: El 1 de junio, el CEO de Nvidia, Jensen Huang, presentó el nuevo modelo de IA Nemotron 3 Ultra durante un evento relacionado con COMPUTEX 2026 en Taipéi, Taiwán, China. Este modelo está orientado a flujos de trabajo de agentes empresariales, cubriendo escenarios como código, investigación, automatización de procesos empresariales y ejecución de tareas prolongadas.

Con el lanzamiento de Nemotron 3 Ultra, el rol de Nvidia continúa expandiéndose de proveedor de chips de IA a una combinación de "plataforma de cómputo + modelo + herramientas de desarrollo". Según información pública, Nemotron 3 Ultra es un modelo de expertos mixtos con 550 mil millones de parámetros, diseñado para agentes de tareas largas, logrando mayor velocidad de inferencia en tareas complejas de agentes y reduciendo costos operativos. Para los clientes empresariales, la presión de costos de las aplicaciones de agentes no proviene solo de consultas individuales, sino de la invocación continua de herramientas, lectura de datos empresariales, ejecución de planes de múltiples pasos, verificación repetida de resultados e inferencia de contexto largo. Si el modelo no puede mantener estabilidad y eficiencia en tareas largas, las empresas difícilmente podrán llevar a los agentes de pruebas internas a sistemas de producción. Al enfatizar la velocidad de inferencia, el costo y la capacidad de tareas largas en Nemotron 3 Ultra, Nvidia responde a la nueva demanda empresarial de IA que pasa de "poder generar contenido" a "poder ejecutar procesos".

Este modelo pertenece a la familia de modelos abiertos Nemotron 3. Anteriormente, Nvidia había lanzado modelos de diferentes escalas como Nano, Super y Ultra, orientados respectivamente a implementación ligera, inferencia de alto rendimiento y tareas complejas de agentes.

Desde una perspectiva técnica, Nemotron 3 Ultra continúa la estrategia combinada de Nvidia en torno a modelos abiertos, NVIDIA NIM, NeMo, CUDA-X y el ecosistema de software empresarial. Al implementar agentes, las empresas generalmente necesitan que el modelo posea múltiples capacidades como razonamiento, generación de código, invocación de herramientas, planificación de procesos, verificación de resultados y control de seguridad, además de adaptarse a nubes privadas, centros de datos locales, software industrial y sistemas de permisos empresariales. La ventaja de Nvidia no solo radica en el modelo en sí, sino en que su GPU, servicios de inferencia, bibliotecas de software y ecosistema de desarrolladores pueden formar una ruta de entrega unificada. Si Nemotron 3 Ultra puede integrarse con la infraestructura de IA existente, ayudará a las empresas a incorporar aplicaciones de agentes en procesos como ciberseguridad, toma de decisiones operativas, colaboración en I+D, servicio al cliente, automatización de TI y análisis de datos, reduciendo los costos de ingeniería de adaptar por separado diferentes modelos y marcos de inferencia.

Este lanzamiento también se alinea con la expansión de Nvidia en PC de IA, IA física y agentes empresariales. En la misma etapa, Jensen Huang también presentó novedades sobre chips para PC, kits de herramientas para agentes y modelos relacionados con robótica, mostrando que Nvidia está extendiendo las capacidades de IA desde los centros de datos hasta terminales personales, escritorios empresariales, robots y conducción autónoma, entre otros escenarios más amplios. Nemotron 3 Ultra asume el rol de complementar capacidades a nivel de agentes empresariales y modelos abiertos, formando junto con chips de hardware, plataformas de inferencia y herramientas de desarrollo la infraestructura de Nvidia para la próxima fase de aplicaciones de IA. Las variables futuras se centran en el grado de apertura del modelo, el costo real de inferencia, la estabilidad en tareas largas, la velocidad de integración con software empresarial y si los desarrolladores estarán dispuestos a construir aplicaciones de agentes especializadas en torno al ecosistema Nemotron.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com

Recomendaciones
SSSTC de Taiwán, China, lanza SSD de refrigeración por inmersión
2026-06-02
Intel lanza Xeon 6+, CPU para centros de datos orientado a cargas de trabajo de agentes inteligentes
2026-06-02
Tencent Cloud de China se asocia con Soniox de EE. UU. para integrar la transcripción de voz en tiempo real en la infraestructura de comunicaciones global
2026-06-02
Sivers de Suecia se asocia con GlobalFoundries de EE. UU. para centrarse en la fotónica de silicio, los centros de datos de IA se orientan hacia motores ópticos de bajo consumo
2026-06-02
Z-COM de Taiwán, China, lanza la nueva plataforma NEW: las redes inalámbricas empresariales se orientan hacia la operación y el mantenimiento inteligentes locales
2026-06-02
Schneider Electric France lanza Uniflair XCA: la refrigeración de centros de datos de alta densidad entra en una fase de expansión eficiente
2026-06-02
Entel de Chile, Vivo de Brasil y Claro implementan la plataforma Motive: eSIM y conexión directa por satélite entran en escenarios comerciales
2026-06-02
Observación sobre la salida al exterior de la información y las comunicaciones el 2 de junio: Centros de datos de IA, banda ancha por satélite y redes 5G+ abren un nuevo espacio para la ingeniería global
2026-06-02
Marvell de EE. UU. lanza un chip de conmutación de 102.4 Tbps, la red de centros de datos de IA entra en una fase de expansión de bajo consumo
2026-06-02
Tasmea, de Australia, adquiere Maxim por hasta 254 millones de AUD, incursionando en el ciclo de expansión de infraestructura eléctrica de centros de datos
2026-06-02