es.wedoany.com Noticia: A medida que el centro de gravedad del mercado de infraestructura de IA pasa del entrenamiento a gran escala al ámbito de la inferencia, las empresas locales de semiconductores de IA de Corea del Sur están acelerando su expansión aprovechando arquitecturas únicas y casos prácticos, buscando encontrar puntos débiles de NVIDIA en el mercado global de infraestructura de próxima generación.
Las principales empresas que lideran el grupo de semiconductores de IA de Corea del Sur incluyen a Rebellions, Mobilint y HyperAccel, cada una compitiendo en función de diferentes mercados objetivo y rutas tecnológicas. Rebellions ha establecido una posición independiente mediante la producción en masa de chips de alto rendimiento y la comercialización a gran escala. Su producto insignia de próxima generación, 'REBEL100', adopta una arquitectura Chiplet avanzada que conecta 4 chips y está equipado con memoria HBM3E de quinta generación, logrando un rendimiento informático de alto nivel comparable al de las GPU insignia existentes, al tiempo que garantiza una excelente eficiencia energética. Rebellions ya ha implementado su NPU en el servicio de resumen de llamadas 'A.' de SK Telecom, que genera hasta 50 millones de llamadas API al día. Actualmente, con un promedio mensual de 20 millones y diario de 700,000 llamadas de inferencia, la NPU de Rebellions ha reemplazado a las GPU existentes y funciona de manera estable. Además, su producto se utiliza en el servicio de diagnóstico asistido por IA para mascotas 'Excalibur', empleado en más de 1,000 hospitales veterinarios en todo el país.

Mobilint se ha centrado desde el principio en el mercado de inferencia tanto para centros de datos como para dispositivos terminales, diseñando NPU de alto rendimiento y bajo consumo. Su producto representativo, 'ARIES', ofrece un rendimiento informático de hasta 80 TOPS con un consumo de solo unos 25 W. Mobilint colabora con la empresa de centros de contacto de IA MetaM para operar una plataforma de servicios de consultoría de IA basada en NPU, y con empresas de IA industrial como POSCO DX para construir y verificar infraestructuras de IA personalizadas para entornos de fabricación. También ha suministrado la IA independiente 'MLX-A1' a la Universidad de Yonsei. Recientemente, Mobilint completó con éxito el 'Proyecto de demostración y difusión de servicios de IA en el borde' respaldado por el Ministerio de Ciencia y TIC de Corea del Sur (MSIT), instalando sus NPU 'ARIES' y 'REGULUS' en dispositivos periféricos como cámaras de detección de incendios forestales y drones, construyendo una infraestructura de gestión de desastres capaz de detectar incendios en tiempo real y predecir rutas de propagación mediante mapas 3D. Mobilint planea lanzar en la segunda mitad de este año el primer SoC de IA independiente entre las empresas surcoreanas de NPU, denominado 'REGULUS'.
HyperAccel, desde sus inicios, ha diseñado específicamente la 'LPU (Unidad de Procesamiento de LLM)' para cargas de trabajo de inferencia de IA generativa y LLM, utilizando memoria LPDDR5x relativamente económica y de bajo consumo, al tiempo que maximiza la utilización del ancho de banda, logrando eficiencia en latencia, eficiencia energética y costo total de propiedad (TCO). HyperAccel, partiendo del servidor 'Orion', impulsa una hoja de ruta de productos orientada a centros de datos y computación en el borde, y colabora con Naver Cloud para construir infraestructura de inferencia de IA optimizada para entornos de centros de datos, y con LG Electronics para aplicar tecnología de inferencia en diversos entornos de dispositivos. A través de la colaboración con socios globales clave como Samsung Electronics, SemiFive, Advantech, INVENTEC y HPE, está demostrando simultáneamente su competitividad técnica y la escalabilidad de su comercialización.

Las tres empresas han captado el cambio de época en el que el centro de gravedad de la infraestructura pasa del entrenamiento a la inferencia y los agentes de IA, diseñando arquitecturas eficientes para cargas de trabajo de inferencia con el fin de maximizar el valor del TCO. Para romper las barreras de bloqueo de hardware y software centradas en NVIDIA, todas han adoptado plenamente ecosistemas de código abierto, apoyando activamente pilas de software propias o SDK, ayudando a los desarrolladores a utilizar directamente marcos como PyTorch, Hugging Face, vLLM y Triton sin necesidad de complejas migraciones o modificaciones de código. Las tres empresas se dedican a acumular casos de referencia prácticos y establecer alianzas globales, comenzando su expansión global basándose en casos acumulados en el mercado nacional, como servicios de resumen de llamadas a gran escala, consultoría de IA y desarrollo conjunto con Naver Cloud.
A medida que el centro de gravedad del mercado de infraestructura de IA se desplaza hacia la inferencia, los servicios en la nube de NPU nacionales (NPUaaS) que combinan relación costo-rendimiento y soberanía tecnológica están atrayendo atención. Más del 55% del gasto global en infraestructura de IA se concentra en la inferencia, y entre el 80% y el 90% del costo del ciclo de vida total proviene de los costos de inferencia, lo que impulsa una creciente demanda de alternativas a las GPU de alto costo. Gabia lanzó oficialmente en abril de este año NPUaaS equipado con el 'ATOM-Max' de Rebellions, un chip que, en la competencia global de evaluación de rendimiento de IA 'MLPerf', alcanza una velocidad de procesamiento de 1.5 a 3 veces la de las GPU de nivel similar, con una mejora de eficiencia energética de 3 a 4.5 veces. KT Cloud ha lanzado oficialmente un producto de 'Servidor NPU' que cumple con las regulaciones de seguridad para instituciones públicas y proveedores de soluciones de agentes de IA públicos, asegurando actualmente alrededor de 300 aceleradores NPU en operación, y planea agregar más tras la producción en masa del chip de próxima generación de Rebellions, 'REBEL100', en el tercer trimestre de este año. Samsung SDS planea lanzar NPUaaS basado en la segunda generación de NPU 'RNGD' de FuriosaAI, integrando directamente los servidores RNGD con la capa de virtualización de la plataforma en la nube de Samsung (SCP) mediante tecnología de virtualización de hardware.
Los CSP coinciden en que la infraestructura de IA del futuro entrará en un entorno de computación heterogéneo con una mezcla de GPU, NPU y TPU, y la 'nube soberana', destinada a mantener la soberanía de los datos, también representa una señal positiva para las NPU nacionales. Para que las NPU aseguren una experiencia de desarrollador comparable a la de 'CUDA' de NVIDIA, el actual proyecto gubernamental K-Cloud apoya la inversión en software de los fabricantes de semiconductores en coordinación. Un experto del sector destacó que el papel de los CSP, como transmisores finales que materializan el valor técnico de los semiconductores de IA nacionales en el terreno, está evolucionando hacia la integración de diseño de servicios, consultoría de optimización de inferencia, automatización de plataformas y monitoreo de seguridad.









