Super Micro Computer publica un plan para centros de datos de IA con 1152 GPU escalables
2026-06-02 09:54
Favoritos

es.wedoany.com Noticia: Super Micro Computer, Inc. presenta planes de soluciones de bloques de construcción para centros de datos (DCBBS) basados en las plataformas NVIDIA Vera Rubin NVL72 y NVIDIA HGX Rubin NVL8. Estos planos están diseñados específicamente para el despliegue de centros de datos de IA a escala de gigavatios, comenzando con una unidad escalable individual que contiene 1152 GPU, la cual puede expandirse a casi cualquier tamaño. Los planos DCBBS de Supermicro ofrecen una solución integral de extremo a extremo, desde el diseño hasta la entrega, y cuentan con un equipo de expertos dedicados que cubren todo el ciclo de vida del despliegue. Esta solución integra computación, almacenamiento, redes, refrigeración líquida avanzada, distribución de energía e infraestructura in situ para acelerar la puesta en marcha de fábricas de IA de refrigeración líquida a gran escala.

Los planos DCBBS de Supermicro están diseñados para abordar los desafíos prácticos de implementación de la infraestructura de IA más avanzada del mundo. La plataforma NVIDIA Vera Rubin aumenta significativamente la densidad de rendimiento de las fábricas de IA, duplicando la velocidad en múltiples áreas de computación. La última arquitectura de referencia de NVIDIA define con precisión el contenido ideal de una unidad escalable de 1152 GPU, mientras que los planos DCBBS de Supermicro definen los pasos concretos para un despliegue exitoso. Supermicro cuenta con un historial probado en el despliegue de las fábricas de IA de refrigeración líquida más grandes del mundo, con más de 100 000 GPU.

Los clientes que planean construir o modernizar una fábrica de IA se enfrentan a una restricción rígida común: la energía eléctrica disponible. Los planos DCBBS para NVIDIA Vera Rubin NVL72 proporcionan una lista de materiales equilibrada dentro de un rango de potencia especificado (de 5 MW a 1 GW), con una proporción adecuada de capacidad de refrigeración, suministro eléctrico, nodos de computación, nodos de gestión, nodos de almacenamiento de alto rendimiento, nodos de plataforma de almacenamiento de memoria de contexto y redes, eliminando los cuellos de botella de rendimiento causados por obstáculos como la suscripción excesiva de la red, las limitaciones de capacidad de energía o la estrangulación térmica.

Estos planos abarcan el proceso completo de extremo a extremo que Supermicro utiliza para completar proyectos de IA a gran escala en un tiempo récord. La investigación de las instalaciones in situ es realizada por el equipo dedicado de Supermicro, analizando la compatibilidad del sitio físico con los requisitos de despliegue, incluyendo muelles de carga, dimensiones de las salas de datos, espacio libre, planos y capacidad de carga del suelo. El diseño y la planificación del proyecto incorporan todos los detalles críticos en un plan de construcción personalizado según los requisitos del cliente y las restricciones de las instalaciones. Supermicro define la combinación correcta de componentes DCBBS, como el esquema de refrigeración: para instalaciones totalmente compatibles con refrigeración líquida directa, se ofrecen unidades de distribución de refrigeración (CDU) de hasta 1,8 MW montadas en fila; para sitios sin infraestructura de agua, se ofrecen unidades laterales montadas de líquido a aire; también se están desarrollando opciones de CDU dentro del bastidor basadas en configuraciones de gabinete de 52U, así como opciones de intercambiadores de calor de puerta trasera complementarios para entornos de alta temperatura ambiente. En la fase de integración de la solución con servicios completos in situ, la mayor parte del trabajo se realiza en sus plantas de fabricación en Estados Unidos, incluyendo el montaje, apilamiento y cableado dentro de cada bastidor. Supermicro verifica la funcionalidad mediante un proceso de prueba que supera los estándares de la industria, cubriendo pruebas a nivel de sistema (L10) y a nivel de clúster (L11) con múltiples nodos. El equipo dedicado gestiona la logística de los componentes in situ, como CDU, torres de refrigeración e infraestructura eléctrica, incluyendo la coordinación con proveedores externos seleccionados por el cliente. Los servicios de entrega integrados y la integración in situ abarcan la colocación de los bastidores, las conexiones eléctricas y de refrigeración, el cableado de red, la puesta en marcha del sistema, la instalación de la pila de software y la validación in situ. En cuanto a soporte, servicios y software, se ofrece una gama de opciones continuas in situ, incluyendo una respuesta in situ en un plazo de 4 horas para requisitos críticos de tiempo de actividad, y soporte para la integración con herramientas de gestión de infraestructura como Supermicro SuperCloud Composer y SuperCloud Director, permitiendo un control unificado desde la gestión de hardware hasta la orquestación de cargas de trabajo multiinquilino, integrando al mismo tiempo pilas de software como NVIDIA AI Enterprise y NVIDIA Run:ai.

La plataforma NVIDIA Vera Rubin tiene el potencial de ofrecer un rendimiento generacional transformador, pero requiere un método repetible y fiable para un despliegue exitoso. Supermicro garantiza que la solución esté alineada con la última arquitectura de referencia de NVIDIA, brindando a los clientes la confianza de que su despliegue es coherente con el ecosistema de socios en la nube de NVIDIA. La unidad escalable central de los planos DCBBS de Supermicro ofrece 1152 GPU NVIDIA Rubin, con 331 TB de memoria GPU HBM4. En comparación con NVIDIA Blackwell, la generación Vera Rubin duplica el ancho de banda de la memoria GPU, el ancho de banda NVLink de GPU a GPU y el ancho de banda de red por GPU, proporcionando la base arquitectónica para entrenar e inferir modelos de IA de vanguardia con billones de parámetros. Su infraestructura complementaria incluye: una pila avanzada de refrigeración líquida directa (DLC-2), que abarca una torre de refrigeración de 5 MW, 4 CDU montadas en fila de hasta 1,8 MW, 16 colectores de distribución de refrigeración montados verticalmente, 576 placas de agua fría de cobre de contacto directo con el chip, y el refrigerante Supermicro SMC PG25-A con excelente estabilidad química y térmica, además de opciones de líquido a aire de 200 kW y 500 kW; infraestructura de distribución eléctrica, desde transformadores de media tensión hasta distribución de baja tensión, bastidores de alimentación a nivel de rack y unidades de batería de respaldo (BBU), con cuatro bastidores de alimentación de 110 kW y unidades de alimentación redundantes de 18,3 kW por cada bastidor Vera Rubin NVL72, y soporte para sistemas de almacenamiento de energía en baterías (BESS) que proporcionan energía de respaldo con conmutación instantánea; gabinetes optimizados de 48U y 52U; 16 bastidores de computación optimizados para las plataformas NVIDIA Vera Rubin NVL72 y NVIDIA HGX Rubin NVL8; 6 bastidores de red (4 para computación, 2 para convergencia), que soportan NVIDIA Spectrum-X Ethernet o NVIDIA Quantum-X800 InfiniBand, con velocidades de estructura de computación de hasta 1,6 TB/s, y opciones de red de fotónica de silicio basadas en óptica copaquetizada (CPO) sin necesidad de transceptores enchufables; 4 bastidores de almacenamiento de alto rendimiento basados en la plataforma de servidores Petascale de Supermicro, para almacenamiento de aplicaciones en capa NVMe y puntos de control de entrenamiento de modelos; además de 2 bastidores de plataforma de almacenamiento de memoria de contexto, optimizados para inferencia de contexto largo, memoria de trabajo de agentes y cargas de trabajo de recuperación. Más información en supermicro.com/vera-rubin.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com