Moore Threads de China lanza el modelo de código abierto MusaCoder para generación de kernels de GPU
2026-06-10 16:33
Favoritos

es.wedoany.com Noticia: El 10 de junio, la empresa china de GPU domésticas Moore Threads anunció el lanzamiento y la apertura del código de MusaCoder. Se trata de un modelo de lenguaje grande especializado en la generación de kernels de GPU de bajo nivel, capaz de generar kernels nativos de GPU en CUDA y MUSA a partir de implementaciones de referencia de PyTorch, centrándose en la computación de alto rendimiento, la optimización del entrenamiento e inferencia de IA y la construcción del ecosistema de software de GPU domésticas.

Los kernels de GPU de bajo nivel son la capa de conexión clave entre los marcos de IA y el rendimiento del hardware. El entrenamiento de modelos grandes, la inferencia, la computación científica y el procesamiento gráfico requieren una gran cantidad de operaciones de cálculo matricial, transformación de tensores, reducción, optimización del acceso a memoria y programación paralela. Si la eficiencia de los kernels de bajo nivel es insuficiente, incluso si se amplía la escala de parámetros del modelo superior, será difícil liberar completamente la potencia de cómputo de la GPU. En el pasado, el desarrollo de kernels dependía en gran medida de la escritura manual y la optimización iterativa por parte de los ingenieros, lo que requería un alto nivel de conocimiento en arquitectura de hardware, programación paralela, jerarquía de memoria y cadena de herramientas de compilación. El lanzamiento de MusaCoder apunta precisamente a este cuello de botella de alta dificultad, con la esperanza de utilizar un modelo de lenguaje grande especializado para mejorar la eficiencia de la generación de kernels de bajo nivel.

La particularidad de este resultado de código abierto radica en que todo su proceso de post-entrenamiento se completó en el clúster de computación inteligente Kuae, construido sobre la base de la MTT S5000. Moore Threads presentó que MusaCoder es el primer modelo de lenguaje grande de código abierto de la industria que completa el entrenamiento y la verificación de toda la cadena basándose en una infraestructura de cómputo de GPU doméstica.

MusaCoder adopta un marco de entrenamiento orientado a la generación de kernels, combinando métodos como la síntesis de datos, el ajuste fino por rechazo y el aprendizaje por refuerzo con retroalimentación de ejecución, lo que permite que el modelo, tras generar el código, pueda ser verificado mediante compilación, corrección numérica y efectos de aceleración reales. La generación de kernels de GPU es diferente de la finalización de código común; que el código pueda ejecutarse es solo el primer paso, lo más crítico es si puede compilarse de manera estable en el backend de hardware especificado, si los resultados son correctos, si no hay retrocesos ilegales y si se obtiene una mejora de rendimiento en la ejecución real. Al incorporar el backend MUSA en el proceso de entrenamiento y verificación, Moore Threads significa que el modelo no solo sirve al ecosistema CUDA general, sino que también se dirige directamente al entorno de computación paralela de GPU domésticas.

Para la industria de GPU domésticas, el significado de MusaCoder va más allá de ser un simple modelo de código abierto. Para que la potencia de cómputo de IA doméstica entre en más proyectos de desarrolladores y empresas, es necesario resolver los problemas de adaptación del ecosistema de software, incluyendo la migración de marcos de aprendizaje profundo, bibliotecas de kernels, compiladores, bibliotecas de comunicación, motores de inferencia y modelos de aplicación. Con la mejora de la capacidad de generación de kernels de bajo nivel, los desarrolladores pueden convertir más rápidamente programas de tensores de alto nivel en código de GPU ejecutable y optimizable, reduciendo los costos de migración manual y ajuste de rendimiento. Para los fabricantes de modelos, instituciones de investigación y equipos de aplicaciones industriales que necesitan adaptarse a GPU domésticas, este tipo de herramientas puede acortar el ciclo desde la migración de código hasta la verificación de rendimiento.

El impacto en la cadena industrial se concentrará en áreas como las herramientas de desarrollo de GPU domésticas, la adaptación de marcos de IA, la optimización del entrenamiento de modelos y los servicios de software de centros de computación inteligente. A medida que los modelos grandes entran en una fase de ingeniería más profunda, la competencia por la potencia de cómputo ya no solo depende de los parámetros máximos de una sola tarjeta, sino también de si la pila de software puede soportar el entrenamiento estable del modelo, el despliegue de inferencia y la optimización del rendimiento. Si MusaCoder puede iterar continuamente y ser utilizado por los desarrolladores, ayudará a que el ecosistema MUSA de Moore Threads acumule más kernels, ejemplos y experiencia en optimización, y también mejorará el valor de verificación del clúster de computación inteligente Kuae en tareas de entrenamiento de modelos grandes y generación de código. Los siguientes pasos incluyen la descarga y uso de los pesos del modelo, los comentarios de los desarrolladores, la expansión del alcance de adaptación del backend MUSA, y si el modelo puede lograr efectos prácticos en más marcos de IA y escenarios de kernels de la industria.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com