Lenovo lanza el supernodo Wentian, con una potencia de cómputo FP8 de más de 28 PFLOPS en 40 tarjetas Noticias Globales

Lenovo lanza el supernodo Wentian, con una potencia de cómputo FP8 de más de 28 PFLOPS en 40 tarjetas

2026-06-26 15:05

Favoritos

es.wedoany.com Noticia: Lenovo celebró ayer una conferencia de prensa en Pekín. Chen Zhenkuan, vicepresidente de Lenovo Group y gerente general del grupo de negocios de Infraestructura de China, anunció que para 2027, el grupo de infraestructura de Lenovo China se fijará el objetivo de 100 mil millones de yuanes, y apuntará a ser el primero en el mercado de servidores de China. Lanzamiento de la solución de supernodo Lenovo Wentian: un solo nodo puede albergar 40 GPU, con una potencia de cómputo FP8 superior a 28 PFLOPS

En esta conferencia, Lenovo presentó la solución de cómputo de supernodo Lenovo Wentian. Un solo nodo puede albergar 40 GPU, con una potencia de cómputo FP8 superior a 28 PFLOPS, y una memoria HBM que supera los 5.76 TB, satisfaciendo las necesidades de entrenamiento e inferencia de modelos de lenguaje grandes con billones de parámetros. El ancho de banda total de acceso a memoria supera los 80 TB/s, con una latencia unidireccional P2P de chip a nivel de cien nanosegundos, resolviendo el cuello de botella de comunicación en clústeres de decenas de miles de tarjetas. Un solo nodo admite 40 tarjetas, expansión horizontal Scale-out del clúster, y también es compatible con configuraciones de 32 tarjetas, satisfaciendo necesidades de entrenamiento, inferencia y desarrollo de pruebas de diversas escalas. Adopta una arquitectura de inserción directa ortogonal sin cables, compatible con chasis estándar de 19 pulgadas, comprimiendo el ciclo de despliegue del clúster a unas pocas horas, reduciendo significativamente la barrera de entrada para clústeres de cómputo a gran escala.

Lenovo también lanzó la plataforma de cómputo heterogéneo Wanquan V5.0, con dos actualizaciones principales. La tecnología de aceleración de entrenamiento e inferencia en clúster, mediante tecnologías centrales como la arquitectura de separación PD por capas y la optimización de caché compartida KV Cache, logra un rendimiento integral líder en entrenamiento e inferencia de modelos grandes, mejorando significativamente la utilización de recursos del clúster. La tecnología de optimización de compilación de núcleos y modelos logra la adaptación automática de gráficos de cálculo y la generación automática de operadores para diferentes modelos, adaptándose profundamente al ecosistema de chips de cómputo diverso, mejorando la eficiencia de cálculo en todo el proceso de entrenamiento e inferencia.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com