es.wedoany.com Noticia: Google DeepMind ha lanzado oficialmente Interactions API, impulsando la transición de Gemini desde la invocación de modelos hacia la ejecución de agentes. Esta API permite procesar simultáneamente invocaciones de modelos Gemini y ejecuciones de agentes en un único punto de acceso unificado (Unified Endpoint). Los desarrolladores solo necesitan pasar el ID del modelo para tareas de razonamiento y el ID del agente para tareas autónomas.
Anteriormente, tras enviar un prompt, la API solo invocaba el modelo y devolvía una respuesta. El cambio clave de Interactions API es que el rol de la API se ha ampliado de la mera invocación de modelos a la gestión de ejecución de tareas de agentes, permitiendo soportar funciones como ejecución de agentes, gestión del estado de tareas, conexión de herramientas y procesamiento en segundo plano dentro de un mismo flujo.

La función de Agente Gestionado (Managed Agent) ayuda a los desarrolladores a crear un sandbox remoto de Linux (Sandbox) con una sola llamada a la API. El agente Gemini puede razonar, ejecutar código, navegar por la web y gestionar archivos dentro de este sandbox.

VentureBeat considera que Interactions API es una interfaz unificada diseñada para que los modelos de lenguaje grandes (LLM) ya no sean solo generadores de texto, sino que se acerquen más a un sistema operativo remoto. Esto significa que el modelo está pasando de ser una herramienta que solo genera respuestas a un sistema capaz de invocar múltiples modelos, realizar llamadas repetidas, usar herramientas e incluso ejecutar código backend.
En cuanto a costos, Interactions API almacena los registros de conversación y el contenido de las tareas en los servidores de Google, por lo que los desarrolladores no necesitan reenviar el mismo contexto largo cada vez. En servicios de agentes que utilizan con frecuencia documentos a gran escala o registros de conversación largos, esto puede reducir los costos de tokens y la latencia de respuesta. Los registros de tareas de los clientes de la versión gratuita se conservan por un día, mientras que los usuarios de pago pueden conservarlos por 55 días. TechCrunch señala que esto ayuda a mantener el estado de la API y reducir los precios, pero las empresas que manejan datos sensibles deben considerar simultáneamente los problemas de gobernanza y residencia de datos.
Ali Chebik, gerente de producto del grupo Google DeepMind, enfatizó en el sitio web oficial que Interactions API se desarrolló basándose en los comentarios de los desarrolladores, y que esta dirección no cambiará tras su lanzamiento oficial.









