Intel se asocia con SambaNova y Foxconn para lanzar una arquitectura de IA de inferencia a nivel de rack Noticias Globales

Intel se asocia con SambaNova y Foxconn para lanzar una arquitectura de IA de inferencia a nivel de rack

2026-06-03 09:43

Favoritos

es.wedoany.com Noticia: Intel se ha asociado con SambaNova y Foxconn para presentar en la Feria Internacional de Computación de Taipéi 2026 una arquitectura a nivel de rack diseñada específicamente para cargas de trabajo de inferencia e IA agente. La plataforma integra los procesadores Intel Xeon, las unidades de flujo de datos reconfigurables SN-50 de SambaNova y las capacidades de integración de sistemas de Foxconn, ofreciendo racks de IA listos para producción dirigidos a centros de datos a hiperescala, empresas y nuevas fábricas de IA. Este movimiento muestra que Intel está impulsando el posicionamiento de la CPU como componente central para despliegues de IA a gran escala, con el fin de satisfacer la tendencia del mercado donde la demanda de inferencia supera gradualmente al entrenamiento de modelos.

Esta arquitectura refleja la evolución de la industria desde una infraestructura centrada en el entrenamiento hacia una centrada en la inferencia. En escenarios de entrenamiento, normalmente una CPU soporta cuatro GPU, pero a medida que las cargas de trabajo agente se expanden, la proporción entre CPU y aceleradores se acerca a 1:1. El diseño del rack prioriza el rendimiento por vatio y el rendimiento por dólar, en lugar de maximizar el rendimiento del entrenamiento. Intel señala que la IA agente impone mayores exigencias a la CPU en términos de orquestación, planificación, gestión de memoria, movimiento de datos y ejecución de cargas de trabajo no matriciales.

Intel ha demostrado una arquitectura de inferencia completamente desacoplada a través de Vector Core Compute, una plataforma respaldada por Vista Equity Partners y Cambium Capital, posicionada como una nube de inferencia dedicada a nivel empresarial. En una demostración ejecutando el modelo MiniMax 2.5, la carga de trabajo se dividió dinámicamente entre diferentes arquitecturas de silicio para optimizar cada etapa del pipeline de IA: la orquestación y ejecución fueron manejadas por el procesador Intel Xeon 6, el procesamiento de decodificación por la SambaNova SN40 RDU, y las operaciones de prellenado por la GPU NVIDIA Blackwell. Este despliegue se considera uno de los primeros pipelines de inferencia en producción que distribuye cargas de trabajo entre diferentes tipos de procesadores. Together.ai ya se ha registrado como el primer cliente comercial.

Los puntos clave del anuncio incluyen: Intel, SambaNova y Foxconn colaboran para ofrecer infraestructura a nivel de rack para despliegues de inferencia e IA agente; Foxconn se encarga de la integración integral de sistemas, fabricación y despliegue, planeando lanzar variantes de CPU de alta densidad para optimizar los costos de inferencia, procesamiento de datos e IA híbrida; Intel presenta el procesador Xeon 6+ (nombre en clave original Clearwater Forest), fabricado con el nodo de proceso Intel 18A, siendo la primera implementación de este proceso en centros de datos. Un solo rack refrigerado por líquido puede soportar hasta 36,864 núcleos Xeon 6+, diseñado para maximizar la concurrencia de agentes de IA dentro de un rango de potencia de aproximadamente 100 kW por rack.

Lip-Bu Tan, CEO de Intel, afirmó que con el auge de la inferencia, la IA agente y la IA física, Intel se compromete a ofrecer innovaciones desde el nivel de chip hasta el de sistema. El enfoque de este anuncio radica en el intento de Intel de definir una arquitectura completa de rack de IA. NVIDIA ya ha expandido su infraestructura de IA de pila completa a través de DGX, NVL72 y diseños de fábricas de IA, mientras que Intel adopta una estrategia similar, posicionando a Xeon como la capa de orquestación para la inferencia de IA, al mismo tiempo que colabora con proveedores de aceleradores especializados. La asociación con SambaNova permite a Intel obtener una arquitectura de acelerador de inferencia madura sin esperar el desarrollo interno de alternativas. En un contexto donde el gasto se desplaza del entrenamiento a los despliegues de IA en producción, métricas como el consumo de energía, la utilización, la latencia y el costo total de propiedad se convierten en indicadores clave. El énfasis de Intel en la densidad de CPU, la integración a nivel de rack y la inferencia desacoplada busca aprovechar las oportunidades de mercado en fábricas de IA que no requieren grandes cantidades de GPU de entrenamiento, pero sí necesitan capacidades masivas de orquestación e inferencia.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com