Kingsoft Cloud de China acelerará la construcción de clústeres de GPU en el segundo semestre para satisfacer la demanda de modelos grandes de Xiaomi y Alibaba
2026-07-02 18:01
Favoritos

es.wedoany.com Noticia: 7 de julio - Kingsoft Cloud de China acelerará la construcción de clústeres de GPU en el segundo semestre para satisfacer la creciente demanda de potencia de cómputo de IA de sus principales clientes. Esta demanda proviene principalmente de los equipos de modelos grandes de Xiaomi Group y Alibaba de China. La demanda de potencia de cómputo de GPU de Xiaomi hacia Kingsoft Cloud ha pasado de un clúster de diez mil tarjetas a un clúster de potencia de cómputo a escala ultra grande, y el presupuesto correspondiente ha aumentado de casi 4.000 millones de yuanes iniciales a más de 10.000 millones de yuanes.

El núcleo de esta expansión es la capacidad de entrega de clústeres de GPU a gran escala. El entrenamiento y la inferencia de modelos grandes de IA requieren altos estándares en cuanto a número de servidores, interconexión de GPU, rendimiento de almacenamiento, ancho de banda de red, suministro eléctrico, disipación de calor y programación de clústeres. La simple compra de servidores GPU no genera directamente potencia de cómputo utilizable. Los proveedores de servicios en la nube deben completar el despliegue integral de recursos del centro de datos, servidores de ocho tarjetas, redes de conmutación, almacenamiento distribuido, programación de contenedores, plataformas de entrenamiento, monitoreo de fallos y sistemas de operación y mantenimiento para transformar los recursos de hardware en servicios de potencia de cómputo de IA que los clientes puedan invocar de forma continua.

El equipo de modelos grandes de Alibaba ha firmado un contrato de arrendamiento de potencia de cómputo de cinco años con Kingsoft Cloud, que involucra más de 3.000 servidores GPU de ocho tarjetas. Según el precio de alquiler mensual en el momento de la firma, el flujo mensual después de la entrega completa será de aproximadamente 300 millones de yuanes, con un ingreso anualizado superior a los 4.000 millones de yuanes. Para los proveedores de servicios en la nube, este tipo de contratos de arrendamiento a largo plazo no solo aumenta los pedidos de ingresos, sino que también mejora la certeza de la construcción de clústeres de potencia de cómputo. La inversión inicial en clústeres de GPU es alta y el ciclo de construcción es largo; si la demanda del cliente es inestable, es fácil que la utilización del equipo sea insuficiente. Los contratos a largo plazo permiten planificar mejor el ritmo de construcción, la compra de servidores, el despliegue de racks y la asignación de recursos de operación y mantenimiento.

La actualización de la demanda de Xiaomi refleja que el consumo de potencia de cómputo en los escenarios de modelos grandes, teléfonos móviles, automóviles y AIoT se está ampliando. La demanda de IA de Xiaomi no solo proviene del entrenamiento de un solo modelo, sino que también puede involucrar IA en el lado del dispositivo de teléfonos inteligentes, cabinas inteligentes de automóviles, procesamiento de datos de conducción autónoma, interacción por voz, algoritmos de imagen, coordinación de dispositivos IoT y plataformas de I+D internas de la empresa. La actualización de un clúster de diez mil tarjetas a un clúster de potencia de cómputo a escala ultra grande significa que las tareas de entrenamiento, ajuste fino, inferencia y procesamiento de datos están pasando de ser necesidades basadas en proyectos a necesidades de infraestructura a largo plazo.

Kingsoft Cloud ya ha realizado múltiples rondas de actualizaciones en la capa de computación inteligente en la nube y plataformas de IA. Su plataforma de computación inteligente, "Kingsoft Cloud Xingliu", se ha actualizado de una plataforma de gestión de recursos a una plataforma integral de flujo completo de entrenamiento e inferencia de IA, que cubre la programación de recursos heterogéneos, la gestión de tareas de entrenamiento, los servicios de inferencia y las API de modelos. Para los clientes de modelos grandes, la GPU subyacente es solo la base; lo que realmente afecta la eficiencia de uso es si los recursos se pueden asignar rápidamente, si las tareas pueden ejecutarse de manera estable, si los fallos pueden manejarse automáticamente y si los procesos de entrenamiento e inferencia pueden conectarse sin problemas.

La construcción de clústeres de GPU también impulsará la demanda de equipos de comunicación y centros de datos. Más de 3.000 servidores GPU de ocho tarjetas corresponden a una gran cantidad de conexiones de red de alta velocidad, conmutadores, módulos ópticos, tarjetas de red, dispositivos de almacenamiento, racks, sistemas de suministro y distribución eléctrica, y sistemas de refrigeración líquida o por aire. Cuanto mayor sea la escala de potencia de cómputo, más importante será la arquitectura de red; el entrenamiento de modelos grandes requiere la colaboración de múltiples máquinas y múltiples tarjetas. Si la latencia de la red y el ancho de banda son insuficientes, la utilización de la GPU se verá afectada, lo que finalmente perjudicará la eficiencia real de entrenamiento del cliente.

La tarea de expansión de Kingsoft Cloud en el segundo semestre se centrará en el ritmo de entrega. El presupuesto de Xiaomi de más de 10.000 millones de yuanes corresponde a un grupo de potencia de cómputo a largo plazo a mayor escala, mientras que el contrato de cinco años de Alibaba corresponde a un clúster de servidores con una producción claramente programable. Para los proveedores de servicios en la nube, lo siguiente es conectar la llegada de los servidores GPU, el montaje en el centro de datos, la depuración de la red, la integración de la plataforma y la aceptación del cliente. Solo cuando el clúster de potencia de cómputo se entregue de manera estable, podrá transformarse verdaderamente en ingresos por entrenamiento, inferencia y servicios en la nube.

Este boletín es una compilación y reproducción de información de Internet global y socios estratégicos, y está destinado únicamente a proporcionar a los lectores la comunicación. Si hay infracción u otros problemas, por favor infórmenos a tiempo, este sitio será modificado o eliminado. Toda reproducción de este artículo sin autorización formal está estrictamente prohibida. Correo electrónico: news@wedoany.com