es.wedoany.com Noticia: Recientemente, la empresa estadounidense de infraestructura de nube nativa de IA, GMI Cloud, anunció que su plataforma respaldará la construcción de una nueva generación de infraestructura orientada a fábricas de IA agente, alineándose con la dirección de la plataforma Vera Rubin impulsada por NVIDIA durante la GTC 2026 en Taipéi. La empresa está construyendo una plataforma en la nube centrada en la inferencia, que ofrece a desarrolladores y empresas la capacidad de implementar, escalar y ejecutar cargas de trabajo de IA de nivel de producción.
La "fábrica de IA agente" destacada por GMI Cloud en esta ocasión apunta a los nuevos requisitos que la infraestructura subyacente debe satisfacer después de que las aplicaciones de IA pasen de consultas únicas a operaciones a largo plazo, colaboración autónoma y procesamiento multimodal. Los recursos tradicionales de IA en la nube se centran más en el entrenamiento de modelos, la inferencia de modelos individuales o las llamadas API; cuando los agentes de IA comienzan a ejecutar planificación, invocar herramientas, procesar imágenes, videos y audio, mantener memoria contextual y operar de forma continua, la plataforma debe admitir simultáneamente inferencia de alto rendimiento y baja latencia, escalado dinámico, aislamiento multiinquilino, gestión de contexto a largo plazo, orquestación de flujos de trabajo y un entorno de ejecución seguro. La cartera de plataformas de GMI Cloud incluye infraestructura de entrenamiento, inferencia y despliegue de producción, el servicio de modelos de baja latencia Prime Inference, API MaaS para modelos propietarios y de código abierto, endpoints dedicados de nivel empresarial, y una capa de orquestación y optimización de infraestructura para operaciones de IA escalables.
La infraestructura de flujo de trabajo agente es una parte clave de este lanzamiento. Las capacidades de la plataforma propuestas por GMI Cloud cubren sistemas de IA autónomos en entornos aislados, basados en invocación de herramientas, y admiten un entorno de despliegue nativo multimodal para aplicaciones de IA de próxima generación. Para los clientes empresariales, estas capacidades se pueden utilizar para construir agentes de atención al cliente, agentes de código, agentes de análisis de datos, sistemas de generación de contenido, asistentes de procesos industriales y flujos de trabajo de automatización empresarial que operan de forma continua. En comparación con las llamadas a modelos comunes, los sistemas de IA agente necesitan mantener el estado durante más tiempo, acceder a herramientas, leer y escribir datos externos, y programar recursos entre múltiples tareas, por lo que la estabilidad, el aislamiento y el control de costos de la plataforma en la nube subyacente afectan directamente la calidad del despliegue de producción.
La seguridad también se sitúa en el centro de la infraestructura de la fábrica de IA. GMI Cloud indicó que está adoptando la capacidad de computación confidencial de NVIDIA para proporcionar un entorno de ejecución confiable para las cargas de trabajo de IA de nueva generación que necesitan proteger la privacidad de los modelos y los datos. A medida que las fábricas de IA procesan datos propietarios de empresas, contenido regulado, contexto de modelos y memoria de agentes, la plataforma de inferencia debe cumplir simultáneamente con los requisitos de rendimiento, privacidad, seguridad y cumplimiento normativo. La plataforma Vera Rubin se considera un nodo importante en la evolución de la infraestructura de las fábricas de IA, diseñada en torno a la computación, redes, seguridad y sistemas de rack de próxima generación, para satisfacer las necesidades de inferencia a gran escala y operación continua de la IA agente.
Este lanzamiento refleja que la competencia en la infraestructura de la nube de IA está pasando de "proporcionar potencia de cálculo de GPU" a "respaldar sistemas inteligentes de nivel de producción". Después de que las aplicaciones de IA ingresen a los procesos centrales de las empresas, los clientes no solo se preocupan por si pueden alquilar GPU, sino también por la latencia del servicio de modelos, el costo de los tokens, la disponibilidad de la plataforma, el aislamiento de seguridad, la orquestación de flujos de trabajo, los endpoints dedicados, el alcance de acceso a modelos y la capacidad de manejar tareas multimodales. GMI Cloud elige posicionarse en torno a la arquitectura nativa de inferencia y la fábrica de IA agente, lo que indica que desea asumir un rol más cercano a la capa de ejecución de producción en la cadena de infraestructura de IA. La variable clave a futuro es si GMI Cloud puede combinar el ecosistema relacionado con Vera Rubin, la capacidad de computación confidencial y la plataforma de inferencia en un producto escalable, y atraer a más desarrolladores, startups y clientes empresariales para implementar agentes de IA complejos en su plataforma en la nube.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









