es.wedoany.com Noticia: Huawei Cloud ha lanzado la pila "Agentic Infra" (infraestructura para agentes inteligentes), que ofrece un conjunto completo de productos de computación, almacenamiento y red, diseñado para soportar la ejecución de agentes de IA a gran escala en una plataforma en la nube basada en NPU. Esta medida se considera el paso más directo del proveedor de servicios en la nube para competir con NVIDIA en el ámbito de la infraestructura de IA.

En el evento Inspire celebrado en Shanghái, Huawei Cloud presentó AICS (Servicio de Clúster de IA), afirmando que puede soportar una plataforma de computación con un clúster de 100.000 tarjetas. Este clúster funciona con el protocolo de interconexión UB (UnifiedBus) desarrollado internamente por Huawei, proporcionando un rendimiento de 5 millones de tokens por segundo entre 1.000 tarjetas, con una capacidad de cómputo total de 200 EFLOPS (exaflops, o 10^18 operaciones de punto flotante por segundo) y una latencia de generación de tokens inferior a 10 milisegundos.
Huawei también lanzó una solución de almacenamiento llamada AMS (Agentic Memory Storage), que proporciona expansión de memoria para chips NPU y reduce los costos de inferencia para tareas de agentes de larga duración mediante una caché de clave-valor (KV) jerárquica.
Otros componentes de la pila incluyen el planificador CCE Volcano Next, que afirma aumentar la utilización de recursos en más de un 30% al fusionar las cargas de trabajo de entrenamiento e inferencia en lugar de aislarlas; y AgentSphere, un entorno de pruebas aislado y seguro donde los usuarios pueden iniciar cientos de miles de instancias de agentes por minuto.
La pila fue presentada durante el discurso de apertura del Dr. Peter Zhou, miembro de la junta directiva de Huawei y CEO de Huawei Cloud. Afirmó que la IA de agentes está impulsando un cambio fundamental en el paradigma de la computación. Huawei muestra su pila de infraestructura en Inspire en un momento en que China impulsa la creación de alternativas nacionales, y el gigante tecnológico está redoblando sus esfuerzos en capacidad de cómputo aprovechando las oportunidades de mercado tras la prohibición de importación de chips estadounidenses. Aunque el CEO de Huawei, Ren Zhengfei, admitió el verano pasado que sus chips están una generación por detrás de sus homólogos estadounidenses, la empresa busca cerrar la brecha rápidamente. El principio de escalado de su diseño de semiconductores, Tau (τ), se centra en mejorar el diseño reduciendo la latencia de propagación de señales en los chips, en lugar de reducir aún más los transistores. Huawei ya ha utilizado este concepto para diseñar alrededor de 381 chips y lo combinará con la arquitectura LogicFolding, que ha mejorado el rendimiento τ en múltiples niveles y es crucial para el desarrollo de la serie de procesadores Kirin.
En el ámbito de los modelos y agentes, Huawei lanzó la plataforma de modelos ModelArts Next, que incorpora un nuevo servicio de aprendizaje por refuerzo como servicio (RLaaS) y una capa de enrutamiento de modelos que puede enviar dinámicamente solicitudes al modelo más adecuado entre más de 20 modelos de socios, incluidos los sistemas de DeepSeek, Zhipu AI y MiniMax. Huawei afirma que la precisión de programación de este motor de enrutamiento supera el 95%, y el costo de inferencia se reduce aproximadamente en un 20%. La lista de socios se ha formalizado como el "Programa de Socios de Modelos de IA". Huawei también lanzó la plataforma empresarial de agentes AgentArts, orientada a tareas de agentes de larga duración a nivel de producción, con una versión de código abierto que comparte más del 90% de su base de código con la versión comercial, así como el portal AgentArts Orchard para construir e implementar agentes a través de una interfaz de línea de comandos.
Huawei ha introducido una capa de seguridad dedicada para esta pila, que incluye cifrado de hardware con clave propia (HYOK) y soporte para computación confidencial entre máquinas virtuales, entrenamiento e inferencia, y afirma haber superado los 1.000 días sin incidentes graves de servicio.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









