El 10 de junio, hora local, Amazon Web Services (AWS) anunció oficialmente la disponibilidad de las instancias Amazon EC2 M9g y M9gd, basadas en su quinto procesador Arm de desarrollo propio, el Graviton5, presentado en diciembre del año pasado. Esto no es solo una iteración de hardware rutinaria, sino que la industria lo considera una jugada clave de AWS para la inminente era de la "IA agente" (Agentic AI).
Proceso de 3 nm, 192 núcleos
Con el auge de la IA agente (Agentic AI), la carga de trabajo de la IA está experimentando un cambio fundamental: de simples "preguntas y respuestas de texto" a "acciones autónomas": razonamiento en tiempo real, generación de código, orquestación de tareas de múltiples pasos y llamadas a herramientas entre sistemas. Estas tareas imponen demandas sin precedentes de alta concurrencia y baja latencia a la unidad central de procesamiento (CPU) encargada del control lógico y la programación. El AWS Graviton5, diseñado con núcleos grandes, gran caché y alta anchura de banda de memoria, está concebido precisamente para satisfacer las necesidades de la "IA agente".
El Graviton5 utiliza el proceso de fabricación de 3 nm de TSMC, empaquetando más transistores con el mismo consumo de energía, logrando una mayor densidad de circuito y eficiencia energética.
El núcleo Neoverse V3 del Graviton5 fue definido conjuntamente por Arm y AWS Annapurna Labs. Aunque su caché de nivel 1 (64 KB) y de nivel 2 (2 MB) no son el mayor atractivo, la caché de nivel 3 (L3 Cache) se ha multiplicado por 5, alcanzando los 192 MB, lo que permite mantener grandes volúmenes de datos activos más cerca del núcleo. Al mismo tiempo, su capacidad de predicción de saltos ha mejorado significativamente, lo que se traduce en un aumento de rendimiento de hasta el 30 % al ejecutar código complejo como bases de datos reales, muy lejos de las pruebas de bucle pequeño que solo sirven para hacer benchmarks.
En cuanto al número de núcleos, el Graviton5 ha pasado de los 96 núcleos del Graviton4 a 192 núcleos, un incremento del 100 %. Pero lo más importante es que AWS ha abandonado la arquitectura de un solo chip de computación (Die) para adoptar un avanzado diseño de 4 chips (Chiplet). Esto significa que los 192 núcleos se distribuyen uniformemente en 4 chips independientes, cada uno con 48 núcleos e integrando un controlador de memoria DRAM dedicado y un controlador de E/S PCIe 6.0.
Este diseño ofrece dos grandes ventajas: en primer lugar, los datos ya no necesitan recorrer largas distancias a través de todo el chip para acceder a la memoria o a los dispositivos de E/S, lo que reduce enormemente la latencia; en segundo lugar, mediante una tecnología de interconexión entre chips personalizada, los cuatro chips pueden proporcionar una anchura de banda de hasta 420 GB/s, garantizando la eficiencia de coordinación de toda la malla de computación.
Más crucial aún, el Graviton5 se convierte en el primer procesador en la nube compatible con memoria DDR5-8800 y PCIe Gen 6. AWS destaca que, gracias a una estrecha colaboración con los fabricantes de DRAM, el Graviton5 ofrece la velocidad de memoria más rápida entre todos los procesadores en la nube actuales. Para aplicaciones sensibles a la anchura de banda de memoria (como grandes bases de datos, análisis en tiempo real), esto supone una relajación significativa de los cuellos de botella.
Además, el Graviton5 adopta un diseño sin tapa (eliminando la tapa metálica de disipación de la CPU para que el dado entre en contacto directo con el dispositivo de refrigeración), lo que reduce el consumo de energía del ventilador de refrigeración en un 33 %.
AWS declaró anteriormente en un comunicado que el Graviton5 es "el chip de diseño propio más potente y eficiente energéticamente hasta la fecha" (our most powerful and energy efficient custom-designed chip yet). Aunque esto se limita al ámbito de los chips de diseño propio de AWS, considerando la posición de mercado de AWS en el sector de chips de servidor Arm, esta afirmación tiene un valor de referencia considerable.
Rendimiento superior de las instancias M9g en múltiples escenarios
Las mejoras en las especificaciones de hardware del Graviton5 deben traducirse en mejoras de rendimiento de las instancias. Como plataforma de lanzamiento del Graviton5, las instancias M9g han presentado resultados convincentes en múltiples dimensiones.
Según datos oficiales de AWS, las instancias M9g, en comparación con las instancias M8g de la generación anterior basadas en Graviton4, ofrecen: un 25 % más de rendimiento en computación general; un 35 % más de rendimiento en aplicaciones web; un 35 % más de rendimiento en inferencia de aprendizaje automático; y un 30 % más de rendimiento en bases de datos.
Durante el período de vista previa de varios meses, varios clientes de referencia de la industria verificaron estas cifras con entornos de producción reales:
ClickHouse: obtuvo una mejora de rendimiento del 36 % sin ningún cambio en el código.
Honeycomb: en una prueba A/B de 6 meses con cargas de trabajo de observabilidad en producción, el rendimiento por núcleo aumentó un 36 %.
HubSpot: tras migrar su base de datos MySQL a M9g, el tiempo de consulta se redujo hasta un 60 %.
Meta: se ha comprometido a desplegar decenas de millones de núcleos Graviton para sus proyectos de IA agente, convirtiéndose en uno de los mayores clientes de Graviton a nivel mundial.
Para cargas de trabajo que requieren almacenamiento local de alta velocidad, AWS ha lanzado simultáneamente las instancias M9gd, que ofrecen hasta 11,4 TB de SSD NVMe, con un 30 % más de IOPS que la generación anterior. En cuanto a redes, la anchura de banda de red de la instancia más grande se ha incrementado a 100 Gbps, la anchura de banda de EBS a 72 Gbps, y se admite la Configuración de Ancho de Banda de Instancia (IBC), que permite a los usuarios asignar dinámicamente hasta el 25 % de la anchura de banda entre la red VPC y el almacenamiento EBS para adaptarse a diferentes tareas sensibles a E/S.
Primera integración del motor de aislamiento Nitro
Más allá del rendimiento, el Graviton5 introduce por primera vez otro hito en el sistema de seguridad de AWS: el motor de aislamiento Nitro.
El aislamiento de virtualización tradicional se basa en una serie de comprobaciones y pruebas de software y hardware, que teóricamente podrían tener vulnerabilidades no descubiertas. El motor de aislamiento Nitro utiliza tecnología de verificación formal, un método que demuestra mediante lógica matemática que el comportamiento del hardware o software cumple exactamente con lo esperado (en lugar de solo mediante casos de prueba específicos). Este motor, como componente dedicado, controla estrictamente el acceso a toda la memoria de las máquinas virtuales, el estado de los registros de la CPU y los dispositivos de E/S a través de un conjunto mínimo de API.
Esto convierte a AWS Nitro en el primer hipervisor de nube verificado formalmente. Ya no se trata de "creemos que es seguro", sino de "está matemáticamente demostrado que es seguro". Para cargas de trabajo sensibles en los sectores financiero, gubernamental y de seguridad, esto proporciona una garantía de aislamiento de nivel matemático sin precedentes.
Disponibilidad y lanzamiento
Actualmente, las instancias M9g y M9gd ya están disponibles oficialmente en las regiones de AWS Este de EE. UU. (Norte de Virginia, Ohio), Oeste de EE. UU. (Oregón) y Europa (Fráncfort). Los clientes pueden adquirirlas mediante pago por uso, instancias reservadas o Savings Plans. Para ayudar a los clientes a migrar sin problemas, AWS también ofrece una guía de inicio rápido para Graviton, un panel de ahorro de costes y un servicio de conversión de código impulsado por IA, AWS Transform, que puede automatizar la migración de aplicaciones Java de la arquitectura x86 a instancias Graviton.
Según los datos publicados por AWS, más de 120 000 clientes utilizan actualmente procesadores Graviton, que admiten más de 350 tipos de instancias, cubriendo desde aplicaciones web, microservicios y contenedores hasta automatización de diseño electrónico (EDA), juegos y codificación de vídeo. Con unos ingresos anuales que superan los 20 000 millones de dólares y un crecimiento de tres dígitos, el negocio de chips demuestra que la estrategia de desarrollo propio de AWS no es solo una exploración tecnológica, sino que se ha convertido en un motor central de beneficios y diferenciación para su negocio en la nube.
El lanzamiento del Graviton5 marca un paso decisivo más de AWS en el camino de los chips de diseño propio en la nube. Ya no se conforma con alcanzar a la arquitectura x86 en relación calidad-precio, sino que, mediante una optimización prospectiva para las cargas de trabajo de IA agente, intenta definir la base de computación de la próxima generación de la nube.
