es.wedoany.com Noticia: La startup de inteligencia artificial Sakana AI ha seleccionado la plataforma Gemini Enterprise Agent Platform de Google Cloud como infraestructura para su sistema multiagente Sakana Fugu. Google Cloud Japón publicó un artículo de caso el 29 de junio detallando la colaboración entre ambas partes.

Sakana Fugu es un sistema multiagente que selecciona o combina múltiples modelos de IA según la dificultad de la tarea. Incluye dos tipos: Fugu, centrado en la velocidad de razonamiento, y Fugu Ultra, de alto rendimiento. En ciertas tareas, Fugu Ultra afirma superar en rendimiento a los modelos de IA Claude Mythos Preview y Claude Fable 5 de la empresa estadounidense Anthropic.
En el mecanismo de orquestación de múltiples modelos, Google Cloud fue seleccionado como infraestructura. Sakana AI indicó que la empresa fue fundada principalmente por ingenieros provenientes de Google y Google DeepMind, por lo que adoptar Google Cloud fue una tendencia natural. Chi Sun, responsable del diseño de la infraestructura de Sakana Fugu, evaluó que Google Cloud es una infraestructura de alta calidad y estable, y que ofrece servicios gestionados capaces de coordinar múltiples modelos.
Chi Sun también mencionó que Sakana Fugu está compuesto por tres capas: la capa frontal, la capa de procesamiento intermedio y la capa de modelos, y que la disponibilidad de todas las herramientas necesarias para construir cada capa fue una de las razones para su adopción.
En la capa frontal, se protegen los modelos contra entradas inapropiadas o ataques DDoS mediante la función de seguridad de red Google Cloud Armor y la función de protección de modelos y agentes Model Armor. La autenticación y protección de usuarios, así como la gestión de claves API, se realizan a través de la plataforma de desarrollo de aplicaciones web Firebase.
La capa de procesamiento intermedio se encarga de tareas como la invocación de modelos, el registro y almacenamiento en caché, y la escritura de datos en el almacén de datos BigQuery.
La capa de modelos combina múltiples modelos según la consulta de entrada para generar respuestas. A través del entorno de ejecución sin servidor Cloud Run y la plataforma de IA Gemini Enterprise Agent Platform (anteriormente Vertex AI), se invocan modelos de empresas como Google de EE. UU., OpenAI de EE. UU. y Anthropic.









