CoreWeave de EE. UU. lanza SUNK Anywhere y capacidades de autoservicio, unificando el modelo operativo de infraestructura de entrenamiento de IA en múltiples nubes
2026-05-05 13:59
Favoritos

es.wedoany.com Noticia: Livingston, Nueva Jersey, EE. UU. — El proveedor de servicios de nube de IA, CoreWeave, anunció oficialmente la expansión de las capacidades de su plataforma SUNK (Slurm on Kubernetes) con el lanzamiento de dos nuevas funcionalidades: SUNK Autogestionado y SUNK Anywhere, diseñadas para ayudar a los equipos de investigación y plataformas de IA a acelerar la creación y operación de clústeres en CoreWeave y en entornos de nube diversos. Chen Goldberg, vicepresidente ejecutivo de Producto e Ingeniería de CoreWeave, declaró que los equipos de IA ahora ejecutan tareas que abarcan más regiones, generaciones de hardware e incluso entornos de nube, y lo que realmente ralentiza su velocidad es tener que volver a aprender toda la pila tecnológica cada vez que cambian de entorno, o perder visibilidad y control tras el cambio. Estas dos nuevas funcionalidades, SUNK Autogestionado y SUNK Anywhere, ofrecen una solución que mantiene la misma disciplina de programación y operación desde el primer clúster del investigador hasta la ejecución en producción formal.

El núcleo de la funcionalidad SUNK Autogestionado reside en transformar la experiencia acumulada por CoreWeave en la operación a gran escala de clústeres de investigación en plantillas estandarizadas reutilizables. Los equipos de plataforma pueden elegir entre dos caminos: para necesidades simples, una ruta guiada para un inicio rápido; para requisitos complejos de entrenamiento a escala de vanguardia, el diseño colaborativo de un entorno personalizado con los arquitectos de soluciones de CoreWeave. Ambas rutas ofrecen un comportamiento consistente, una sólida visibilidad operativa y una gestión del ciclo de vida totalmente a cargo de CoreWeave. El autoservicio integra simultáneamente dos capacidades: el aprovisionamiento automatizado de usuarios y la configuración de usuarios SUNK. La primera sincroniza usuarios y grupos desde el proveedor de identidad al sistema de gestión de identidad y acceso de CoreWeave mediante el protocolo SCIM; la segunda configura automáticamente los usuarios POSIX, grupos, claves de protocolo de shell seguro y la información de cuentas de Slurm dentro de cada clúster, comprimiendo el proceso de incorporación manual en un flujo automatizado.

SUNK Anywhere extiende las capacidades unificadas del sistema de entrenamiento más allá de la infraestructura de CoreWeave. Cuando una organización necesita ejecutar entrenamiento de IA en diferentes proveedores o en su propia infraestructura, SUNK Anywhere cubre todos los entornos con el mismo modelo operativo y flujo de trabajo, evitando que los equipos de plataforma se vean forzados a mantener diferentes sistemas de entrenamiento, flujos de trabajo o prácticas operativas en distintos entornos. La barrera de implementación de SUNK Anywhere se mantiene en un nivel extremadamente bajo: desplegar SUNK fuera del entorno de CoreWeave requiere cambios de configuración mínimos. Además, la nueva funcionalidad de detección de nodos GPU rezagados de SUNK Anywhere amplía el sistema de observabilidad de Mission Control: el sistema puede localizar con precisión la única GPU que está ralentizando el trabajo de entrenamiento general, permitiendo a los investigadores identificar y reiniciar los nodos fallidos al instante mientras el trabajo está en ejecución.

Dylan Patel, fundador y analista jefe de Semianalysis, señaló que, incluso si los clientes han firmado contratos de compromiso a largo plazo, existen numerosas razones para necesitar poner en marcha clústeres rápidamente mediante autoservicio. Josh Meibos, director sénior de Ingeniería de Plataformas de Recursion Pharmaceuticals, reveló que, gracias a SUNK, la utilización de los clústeres de GPU de su compañía aumentó de aproximadamente el 85% a más del 95%, y el número de usuarios concurrentes se expandió de unas pocas docenas a cientos, sin que el tamaño del equipo de ingeniería de plataformas creciera proporcionalmente. IBM utilizó SUNK para reducir el tiempo de despliegue de trabajos de entrenamiento distribuido a gran escala, que antes requería intervención manual, a cero, duplicando la velocidad de despliegue de los trabajos.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com

Recomendaciones
ParityQC de Austria demuestra la computación cuántica con mediciones en el plano YZ, completando el rompecabezas de la universalidad en un solo plano y eliminando el cuello de botella de las interconexiones de largo alcance
2026-05-05
Ericsson de Suecia lidera el Radar Frost de infraestructura de redes 5G por sexto año consecutivo, con una inversión en I+D cercana al 21% de sus ingresos
2026-05-05
York Space Systems lanza en Estados Unidos una serie de plataformas satelitales estandarizadas
2026-05-05
CoreWeave de EE. UU. lanza SUNK Anywhere y capacidades de autoservicio, unificando el modelo operativo de infraestructura de entrenamiento de IA en múltiples nubes
2026-05-05
Cisco de EE. UU. lanza en código abierto el kit de herramientas de trazabilidad de modelos Model Provenance Kit, que rastrea los riesgos de la cadena de suministro de modelos de IA con una "prueba de ADN"
2026-05-05
Anthropic de EE. UU. se asocia con Blackstone, Goldman Sachs y otros para formar una empresa conjunta de 1.500 millones de dólares para promover el despliegue empresarial de la IA Claude
2026-05-05
El número de agentes de IA empresariales a nivel mundial alcanza los 28,6 millones, y las plataformas de gestión de agentes se convierten en una nueva categoría de infraestructura
2026-05-05
GlobalFoundries de EE. UU. lanza la plataforma óptica de coempaquetado de fotónica de silicio SCALE, demuestra DWDM bidireccional de 8λ y 16λ y supera la especificación OCI MSA
2026-05-05
El avance en tolerancia a fallos del programa cuántico de Harvard en EE. UU. impulsa tres empresas; Lukin afirma que "la era de la computación cuántica a gran escala se adelanta al menos cinco años"
2026-05-05
La india Pixxel se une a Sarvam AI para lanzar a finales de 2026 el primer satélite centro de datos orbital, Pathfinder
2026-05-05