La startup alemana de chips de IA Tensordyne lanza el sistema Napier Noticias Globales

La startup alemana de chips de IA Tensordyne lanza el sistema Napier

2026-06-21 17:05

Favoritos

es.wedoany.com Noticia: La startup alemana de chips inteligentes de inteligencia artificial Tensordyne ha lanzado un nuevo sistema llamado "Tensordyne Napier", que utiliza matemáticas logarítmicas para reemplazar los multiplicadores tradicionales. Al ejecutar tareas de inferencia de IA, su consumo de energía es de aproximadamente 300 vatios, significativamente inferior a los 1000 vatios de los chips similares de Nvidia.

Tensordyne, con sede en Múnich y Sunnyvale, fue fundada en 2017 y cuenta con unos 115 empleados. La empresa ya ha completado la fabricación de los chips, producidos por TSMC con un proceso de 3 nanómetros, y colabora con HPE Juniper Networks, Broadcom y TSMC. Los primeros lotes constan de aproximadamente 1000 chips, cuyas placas de circuito se fabrican en Taiwán, y el ensamblaje final del sistema se realiza en las instalaciones de Flex en Malasia.

La innovación central, "TDN Math", se basa en reglas de operaciones logarítmicas: el logaritmo de A multiplicado por B es igual al logaritmo de A más el logaritmo de B, lo que permite reemplazar la multiplicación por sumas, eliminando la necesidad de multiplicadores tradicionales. Esto reduce el área y el consumo de energía dedicados exclusivamente al cálculo, dejando más espacio para componentes como memoria y conexiones de datos. Actualmente, el tamaño máximo del chip es de aproximadamente 800 milímetros cuadrados. Además de la tecnología matemática, el sistema incluye un procesador de IA desarrollado internamente, "TDN AIP" (que integra SRAM y memoria de alto ancho de banda en el chip), y una tecnología de interconexión entre chips, "TDN Link" (con una latencia inferior a 1 microsegundo).

En el ámbito del software, Tensordyne es compatible con los frameworks PyTorch y Triton, y está construyendo un centro de modelos en Hugging Face. Modelos grandes de expertos mixtos como DeepSeek, Qwen o Kimi, que anteriormente se ejecutaban en 64 chips de Nvidia, pueden adoptar directamente la misma configuración. La diferencia radica en la conexión física: los sistemas grandes de Nvidia utilizan una gran cantidad de cables, mientras que Tensordyne logra la comunicación entre chips a través de la tecnología de chasis de HPE Juniper, completamente sin cables, y la transmisión de datos se realiza mediante señales eléctricas.

Resumen técnico. (Fuente de la imagen: Tensordyne)

Actualmente, la empresa ha completado una financiación de más de 200 millones de dólares, con inversores que incluyen a Celesta Capital y el fondo del CEO de Intel, Chen Liwu. Planea realizar una ronda de financiación Serie D en el cuarto trimestre de 2026. Tensordyne afirma haber recibido pedidos anticipados de varios proveedores de "Neo Cloud" y ha firmado un acuerdo de desarrollo conjunto con una empresa de hiperescala (cuyo nombre no se ha revelado). El tamaño de cada contrato individual es de aproximadamente 10 a 20 millones de dólares, y se espera que el valor total de los pedidos anticipados alcance los 100 millones de dólares antes de fin de año.

El cofundador Gilles Backhus señaló que el consumo de energía en la inferencia de IA aumentará significativamente debido a factores como la generación de video. Un flujo de video 4K en tiempo real podría consumir aproximadamente 100 kilovatios. Con el hardware actual de Nvidia, por ejemplo, el costo de generar una hora de contenido de video con IA supera los 1000 dólares, mientras que el sistema de Tensordyne puede reducir el costo a entre aproximadamente 60 y 100 dólares por hora, con entrega en tiempo real y sin pérdida de resolución. Además, el tiempo de respuesta para consultas complejas puede reducirse a 30 segundos mediante el procesamiento paralelo de 72 chips, y los modelos grandes de expertos mixtos pueden generar hasta 1000 tokens por segundo por usuario. El costo por millón de tokens se puede consultar en la "Tokenomics Calculator" del sitio web oficial. Backhus señaló que la calidad del compilador también es crucial; la diferencia entre un buen compilador y uno excelente puede aumentar la utilización del chip del 30% al 90%.

Backhus enfatizó que la verdadera innovación radica en la arquitectura y las matemáticas, no en la selección de materiales. Los chips de primera generación con proceso de 7 nanómetros ya incorporaban matemáticas logarítmicas y han funcionado sin fallos durante aproximadamente dos años y medio en pruebas continuas. El principal cuello de botella actual es la memoria de alto ancho de banda (HBM), que es producida principalmente por Samsung, Micron y SK Hynix.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com