es.wedoany.com Noticia: Qualcomm anuncia su incursión en la infraestructura de IA para centros de datos. La semana pasada (Día del Inversor 2026), la compañía presentó la serie de aceleradores AI250 basada en una arquitectura de computación de memoria cercana, que apila DRAM para formar un módulo unificado de computación y almacenamiento, con el objetivo de ofrecer una eficiencia de inferencia superior a la de las GPU actuales.

Qualcomm denomina a esta tecnología Computación de Alto Ancho de Banda (HBC). Tony Pialis, vicepresidente ejecutivo de centros de datos, afirmó en la presentación para inversores que HBC ofrece las ventajas de rendimiento de la SRAM, combinadas con la densidad y capacidad de almacenamiento de las pilas HBM. La serie AI250, que se lanzará el próximo año como parte del sistema de rack Dragonfly, marca un cambio significativo en la estrategia de infraestructura de IA de Qualcomm. Aunque los procesadores Snapdragon ya incorporan NPU, en el ámbito de los centros de datos, Qualcomm había tenido dificultades para obtener la misma atención del mercado que Nvidia, AMD o incluso startups como Cerebras.
En comparación con las GPU de los dos gigantes, la serie de aceleradores AI de Qualcomm actualmente no tiene ventaja, pero la empresa busca dejar su huella en el sector de centros de datos. La tarjeta única AI250 afirma tener 768 GB de capacidad de almacenamiento y un ancho de banda de memoria efectivo de hasta 133 TB/s. Como referencia, la Groq 3 LPU de Nvidia solo ofrece 500 MB de SRAM y 150 TB/s de ancho de banda. Qualcomm reconoce que estas cifras dependen del término "efectivo", ya que su sistema Dragonfly basado en AI200 afirma un ancho de banda de memoria "efectivo" total de 414 TB/s para los 56 chips, pero lograr este valor solo con LPDDR5x a 8800 MT/s requeriría un bus de 6720 bits de ancho, algo que la compañía casi con certeza no tiene. Qualcomm insiste en que esto representa "el ancho de banda físico puro de la interfaz LPDDR", pero se niega a explicar cómo logra lo que Nvidia necesita ocho pilas HBM3e para conseguir.
Los materiales de marketing de Qualcomm muestran que, con la transición a HBC, la AI250 ofrecerá 18 veces el ancho de banda efectivo de la AI200, y la próxima AI300 proporcionará 54 veces ese ancho de banda. Estos multiplicadores "efectivos" son en realidad características de la arquitectura HBC. Al mover parte de las unidades de cómputo XPU debajo de la DRAM, se puede reducir significativamente el consumo de energía del chip. Las GPU tradicionales para centros de datos dependen del intercambio de datos entre HBM y el dado de cómputo; incluso con tecnologías de empaquetado avanzado como CoWoS de TSMC, el consumo sigue siendo considerable. HBC, al apilar DRAM directamente sobre parte de la lógica y usar conexiones Through-Silicon Via (TSV), acorta drásticamente la ruta entre el cómputo y el almacenamiento. Pialis lo compara con trabajar en el edificio donde se vive: solo hay que moverse hacia arriba y hacia abajo, sin necesidad de usar autopistas ni costosos interpositores de silicio.
La ventaja de ejecutar operaciones limitadas por ancho de banda en el dado base es reducir la cantidad de datos transferidos entre HBC y el SoC, amplificando así el ancho de banda de la memoria. Es probable que Qualcomm no ejecute toda la pila de software de IA en HBC, ya que un mayor ancho de banda de memoria beneficia principalmente la fase de decodificación, donde todos los pesos activos del modelo fluyen desde la memoria de forma autorregresiva token por token. La decodificación no es intensiva en cómputo, por lo que realizarla parcial o totalmente en HBC evita las restricciones térmicas de enterrar unidades de cómputo bajo múltiples capas de DRAM. Qualcomm indica que la AI250 puede usarse como acelerador de IA independiente o en una arquitectura de inferencia desagregada, utilizando GPU u otros componentes de Qualcomm para el procesamiento de indicaciones, mientras que la AI250 acelera las operaciones de decodificación intensivas en memoria. Qualcomm no proporcionó datos de FLOPS máximos en la presentación de la AI250 y, cuando se le solicitó, se negó a revelar detalles.
Aunque Qualcomm es una de las primeras empresas de diseño de chips en promocionar la computación de memoria cercana o HBC, esta tecnología no está fuera del alcance de Nvidia o AMD. Se rumorea que tanto Nvidia como AMD están colaborando con proveedores de HBM y TSMC para desarrollar dados base personalizados que mejoren el rendimiento de sus próximos chips. Qualcomm afirma que su HBC "utiliza memoria LPDDR en una arquitectura de computación de memoria cercana especialmente construida, que combina cómputo y un ancho de banda de memoria altamente acelerado en un diseño de silicio apilado en 3D. HBC es una arquitectura única diseñada para abordar el cuello de botella del movimiento de datos en IA al acercar el cómputo a la memoria, mejorando la eficiencia del ancho de banda de la memoria y aumentando la eficiencia energética en cargas de trabajo de inferencia de IA. HBM tiene más pilas de DRAM, utiliza interpositores 2.5D para tender más líneas y no realiza cómputo en el dado lógico base." La startup de chips de IA d-Matrix también está desarrollando aceleradores que utilizan DRAM apilada en 3D para expandir la capacidad de cómputo en memoria.
Durante el Día del Inversor, Qualcomm también anunció la adquisición de la startup de software de IA Modular. Modular fue fundada por Tim Davis y Chris Lattner, este último creador de LLVM, Clang, el lenguaje de programación Swift y la infraestructura del compilador MLIR (Representación Intermedia Multinivel). En Modular, Lattner y su equipo desarrollaron Mojo, una interfaz de programación de bajo nivel orientada a GPU que ofrece una alternativa de alto rendimiento a las pilas Nvidia CUDA o AMD HIP y ROCm. La idea central es que los usuarios puedan escribir aplicaciones de IA de alto rendimiento sin preocuparse por el hardware subyacente. Para Qualcomm, Mojo ofrece la oportunidad de sortear el foso de CUDA; los clientes no necesitan elegir una plataforma, pueden desarrollar aplicaciones y ejecutarlas en cualquier recurso de cómputo disponible en ese momento. Modular también ha desarrollado una plataforma de servicios llamada Max, similar a SGLang o vLLM, que puede ejecutarse indistintamente en hardware AMD o Nvidia. Al estar construida sobre Mojo, teóricamente requiere casi ningún ajuste manual.
Si la adquisición se completa este año sin intervención regulatoria, este producto debería ayudar a Qualcomm a competir en un entorno donde el software se está volviendo más importante que el hardware. Qualcomm planea lanzar la serie de racks AI200 a finales de este año, el primer AI250 basado en HBC a partir de 2027, y la segunda plataforma HBC está programada para 2028. La compañía también ha revelado previamente información sobre su nuevo CPU para centros de datos.









