Saturn Cloud de EE. UU. lanza la plataforma Token Factory para operadores de nube de GPU
2026-06-10 11:50
Favoritos

es.wedoany.com Noticia: Saturn Cloud, la plataforma de desarrollo de IA orientada a operadores de nube de GPU, ha lanzado la plataforma Token Factory, que permite a los equipos de IA empresarial completar todo el proceso de ajuste fino de modelos y servicios de inferencia en la infraestructura de GPU del operador. Esta plataforma permite a los operadores de neocloud, constructores de fábricas de IA y usuarios empresariales ofrecer a sus clientes tareas de ajuste fino gestionadas, gestión de conjuntos de datos y puntos finales de inferencia compatibles con OpenAI, todo facturado por token y entregado bajo la marca del operador, sin necesidad de desarrollar o mantener ningún componente por su cuenta.

Los operadores de nube de GPU han realizado grandes inversiones en infraestructura de aceleración, con sistemas NVIDIA Grace Blackwell, NVIDIA Blackwell y NVIDIA Hopper ya desplegados a gran escala, y los ingresos del negocio de neocloud crecen rápidamente. Sin embargo, el modelo de negocio de muchos operadores sigue limitándose al alquiler de capacidad de GPU por hora. Las necesidades de los clientes empresariales han superado la mera provisión de capacidad de cómputo; requieren entornos de desarrollo gestionados, orquestación de entrenamiento distribuido, pipelines de ajuste fino de modelos, inicio de sesión único (SSO) y control de acceso basado en roles (RBAC), seguimiento de uso y herramientas de cumplimiento normativo. La mayoría de los operadores de nube de GPU carecen de personal para construir internamente esta infraestructura de plataforma, lo que normalmente requiere meses de desarrollo de ingeniería y mantenimiento continuo.

Sebastian Metti, fundador de Saturn Cloud, afirmó que los operadores no deberían tener que construir desde cero una plataforma de desarrollo de IA para que su infraestructura de GPU esté disponible para los equipos empresariales. Saturn Cloud ofrece desde el principio entornos gestionados, orquestación de entrenamiento, ajuste fino, puntos finales de inferencia compatibles con OpenAI y facturación por token.

La plataforma Token Factory permite a los equipos de IA ajustar y servir modelos abiertos sin necesidad de gestionar la infraestructura. Los usuarios solo necesitan cargar conjuntos de datos, configurar tareas de ajuste fino e implementar los modelos generados en puntos finales de inferencia, todo dentro del entorno de marca del operador. Las tareas de ajuste fino admiten el ajuste supervisado (pesos completos y LoRA) de modelos abiertos; cuando la instancia seleccionada cuenta con múltiples GPU, el sistema configura automáticamente DeepSpeed para múltiples GPU. El usuario especifica el modelo base, el conjunto de datos y algunos hiperparámetros, y Saturn Cloud genera la configuración completa de entrenamiento, manejando la orquestación, los reintentos y la salida de puntos de control. Los frameworks de entrenamiento compatibles incluyen Axolotl, vLLM, Unsloth, TRL, PEFT y DeepSpeed.

Los conjuntos de datos son colecciones de datos de entrenamiento tipificados y validados, con formatos que incluyen conversacional, instructivo, texto o pre-tokenizado. Los usuarios pueden cargar conjuntos de datos directamente, importarlos desde fuentes externas (como S3, NFS) o prepararlos en un espacio de trabajo gestionado, y luego registrarlos como conjuntos de datos de Token Factory. Todo el almacenamiento de conjuntos de datos utiliza un sistema de archivos paralelo de alto rendimiento en lugar de almacenamiento de objetos, para eliminar la sobrecarga de arranque en frío y evitar la reducción de la utilización de GPU durante el entrenamiento.

La gestión de puntos de control y linaje de artefactos se realiza automáticamente. Una vez completada la tarea de ajuste fino, los puntos de control generados se registran en el registro de artefactos de Saturn Cloud, conservando el linaje completo desde la ejecución del entrenamiento hasta los pesos del modelo. Los puntos de control pueden utilizarse inmediatamente como entrada para la implementación de puntos finales de inferencia. Los puntos finales de inferencia implementan modelos ajustados o base como puntos finales de servicio persistentes, respaldados por vLLM, cada implementación con un subdominio independiente, monitoreo de salud y medición por token. La configuración del servicio (como dtype, longitud máxima de contexto, cuantización) se genera en el momento de la implementación, sin necesidad de scripts de servicio personalizados. Todo el flujo de trabajo está aislado por organización, y los recursos de Token Factory están limitados al ámbito del inquilino, garantizando que los conjuntos de datos, puntos de control y puntos finales de un cliente no sean visibles para otros.

Saturn Cloud ofrece a los operadores de nube de GPU una ruta integral desde la infraestructura de metal desnudo hasta una plataforma de IA generadora de ingresos. La capa de funciones orientada a operadores incluye marca blanca, facturación de infraestructura por token y por hora de GPU, incorporación de inquilinos y aprovisionamiento de autoservicio, paneles de uso e informes de facturación, así como herramientas de seguridad empresarial (que abarcan SSO, RBAC y cumplimiento SOC 2). Sin la capa de plataforma, los operadores solo pueden vender tiempo de cómputo, cayendo en una competencia de precios; con Saturn Cloud, pueden vender la plataforma, compitiendo en experiencia del desarrollador, postura de seguridad y tiempo de comercialización. La plataforma permite a los operadores superar las auditorías de seguridad empresarial, ya que las herramientas de cumplimiento están integradas, al tiempo que permite a los operadores mostrar a los inquilinos paneles de uso, control de costos y gestión de equipos, y proporciona al equipo de ventas del operador demostraciones de producto en lugar de hojas de especificaciones.

Los equipos de IA y desarrolladores que trabajan en la infraestructura del operador obtienen entornos de desarrollo gestionados (compatibles con JupyterLab, VS Code, RStudio y acceso SSH), entrenamiento distribuido con múltiples GPU (incluyendo orquestación, reintentos y registros), Token Factory para ajuste fino y servicio de modelos abiertos, y soporte preconfigurado para NVIDIA CUDA, controladores de GPU y frameworks de IA. Los ingenieros pueden utilizar todo el clúster de GPU del operador, incluidos los sistemas NVIDIA Hopper, Blackwell y Blackwell Ultra, así como el sistema a nivel de rack NVIDIA GB200 NVL72. Saturn Cloud es miembro del programa de aceleración de startups NVIDIA Inception.

Saturn Cloud se integra con socios de automatización de infraestructura en el ecosistema, incluyendo Mirantis k0rdent AI, Spectro Cloud, OpenNebula y Rafay. Los operadores que gestionan Kubernetes directamente en el backend de la nube también pueden implementar Saturn Cloud sobre su pila existente, sin necesidad de modificar la capa de infraestructura.

Las funciones de Token Factory ya están disponibles para operadores de nube de GPU, neoclouds y empresas que operan su propia infraestructura de GPU. Las organizaciones interesadas en implementar la plataforma pueden contactar a Saturn Cloud para una evaluación.

Saturn Cloud es una plataforma de fábrica de tokens de IA para neoclouds, operadores de fábricas de IA y empresas, que ofrece ajuste fino gestionado, servicio de modelos compatible con OpenAI (facturado por token), entornos gestionados, entrenamiento distribuido y seguridad y gobernanza empresarial. La plataforma admite múltiples arquitecturas de GPU y puede implementarse en entornos de nube pública, nube privada y locales.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com