Centros HPC de EE. UU. y Japón debaten los desafíos de las plataformas de IA científica en TPC26
2026-06-11 09:41
Favoritos

es.wedoany.com Noticia: La IA está generando una nueva serie de demandas para los centros de HPC. Los investigadores ya no se centran únicamente en el entrenamiento de modelos; muchos comienzan a buscar servicios de inferencia y agentes de IA como parte de su investigación diaria. Para los centros de HPC, esto implica determinar cómo ofrecer estos servicios a gran escala y hacer que funcionen en conjunto con la infraestructura HPC existente.

Estos problemas fueron el foco principal de la sesión «Plataformas de IA científica: Inferencia, agentes y servicios de IA en instalaciones HPC» de la conferencia TPC26. El debate reunió a ponentes de laboratorios nacionales, centros de supercomputación, la industria e instituciones de investigación, quienes compartieron cómo construyen y operan servicios de IA para investigadores. Entre los participantes se encontraban el Dr. İlkay Altıntaş, director científico de datos del Centro de Supercomputación de San Diego (San Diego Supercomputer Center) e investigador principal de la Plataforma Nacional de Datos (National Data Platform); el Dr. Venkat Vishwanath, responsable de IA de la Instalación de Computación de Liderazgo de Argonne (Argonne Leadership Computing Facility); el Dr. Jason Haga del Instituto Nacional de Ciencia y Tecnología Industrial Avanzada de Japón (National Institute of Advanced Industrial Science and Technology, AIST); Samantha Sury de HPE; la Dra. Paola Buitrago del Centro de Supercomputación de Pittsburgh (Pittsburgh Supercomputing Center); la Dra. Shoaja Fan; y el Dr. Dan Stanzione, director ejecutivo del Centro de Computación Avanzada de Texas (Texas Advanced Computing Center, TACC).

El Dr. Altıntaş inició el debate con una visión general de la Plataforma Nacional de Investigación (National Research Platform), que proporciona a los investigadores acceso a modelos de IA a través de servicios compartidos. El Dr. Altıntaş señaló que la plataforma debe considerarse en tres niveles diferentes, incluido el nivel de infraestructura, que abarca la computación, el almacenamiento y todo lo que los rodea, similar a los servicios HPC, pero en lugar de horas de núcleo, se consideran tokens. La Plataforma Nacional de Investigación ofrece actualmente nueve modelos abiertos, con el objetivo de que los investigadores puedan obtener capacidades de IA sin necesidad de implementar y gestionar su propia infraestructura. Este tema se repitió a lo largo de la sesión, donde los ponentes debatieron cómo los centros HPC se están adaptando a la creciente demanda de servicios de inferencia y herramientas de IA.

La construcción de estos servicios también requiere una infraestructura diseñada específicamente para la inferencia. La presentación del Dr. Haga se centró en describir los esfuerzos de Japón para evaluar una serie de aceleradores de IA y tecnologías de inferencia a través de un programa nacional de bancos de pruebas. Haga indicó que el programa evalúa una diversa gama de aceleradores de IA de vanguardia y desarrolla tecnologías para ofrecer servicios de inferencia de alto rendimiento, así como métodos para acceder de manera práctica a estos diferentes recursos computacionales. Para los investigadores, el hardware en sí mismo suele ser secundario; lo importante es que el servicio esté disponible, tenga un buen rendimiento y pueda integrarse en su trabajo sin que ellos tengan que convertirse en expertos. El proyecto busca ayudar a los investigadores a probar diferentes plataformas de hardware de IA y proporcionar un marco para implementar servicios de inferencia, estudiando cómo una cartera más amplia de aceleradores puede respaldar futuras cargas de trabajo de IA científica.

Las presentaciones destacaron el desafío que enfrentan las instalaciones HPC: a los investigadores no les importa qué hardware se ejecuta en segundo plano, pero esperan cada vez más que los servicios de IA estén disponibles en el momento que los necesiten.

Aunque el debate se centró principalmente en la infraestructura y la tecnología, el Dr. Stanzione consideró que los problemas económicos podrían convertirse finalmente en un desafío mayor. Stanzione señaló que los tokens realmente cuestan dinero, y cuando la gente los usa en grandes cantidades, muchos laboratorios han discutido en los últimos meses la posibilidad de abandonar su uso. A medida que los servicios de IA se vuelven más ampliamente disponibles, el uso aumenta rápidamente, lo que genera una serie de presiones diferentes a las de las cargas de trabajo tradicionales de HPC, especialmente cuando las instituciones intentan equilibrar la creciente demanda con presupuestos limitados. Según Stanzione, el desafío a largo plazo podría no ser construir plataformas de inferencia, sino encontrar formas de operarlas de manera sostenible. Indicó que, entre los numerosos problemas técnicos, a largo plazo, el aspecto financiero podría impulsar las acciones más que cualquier otro factor.

El debate mostró cómo las instalaciones HPC se están adaptando a la siguiente fase de las aplicaciones de IA. Aunque gran parte de la atención de la industria sigue centrada en los modelos y el hardware, los ponentes volvieron repetidamente a la realidad práctica e inevitable de ofrecer la IA como un servicio. Desde las plataformas de inferencia compartidas y los bancos de pruebas de aceleradores hasta la economía del consumo de tokens, los desafíos discutidos en las presentaciones indican que el futuro de la IA científica podría depender tanto de las operaciones y la infraestructura como de los avances en los propios modelos.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com