Google integra el control de dispositivos en Gemini 3.5 Flash Noticias Globales

Google integra el control de dispositivos en Gemini 3.5 Flash

2026-06-29 10:56

Favoritos

es.wedoany.com Noticia: Google ha integrado la capacidad de control de dispositivos directamente en el modelo Gemini 3.5 Flash. La compañía ha lanzado recientemente la función "Computer Use" para su modelo de IA Gemini 3.5 Flash, que permite al modelo controlar directamente los dispositivos físicos del usuario y ejecutar acciones en su nombre. Anteriormente, Google ya ofrecía a los consumidores funciones de IA agente para controlar ordenadores virtuales remotos y navegadores a través de Gemini Spark, pero la nueva función Computer Use amplía el control a los dispositivos físicos que el usuario tiene frente a sí. Google había proporcionado anteriormente un modelo independiente Gemini 2.5 Computer Use para el control de dispositivos, y ahora lo ha integrado directamente en Gemini 3.5 Flash, permitiendo a los desarrolladores acceder a capacidades de control de dispositivos, búsqueda, mapas y más desde la misma plataforma sin necesidad de cambiar a un modelo especializado.

Un teléfono inteligente muestra el logotipo brillante de Google Gemini sobre un fondo oscuro.

El modelo independiente anterior, Gemini 2.5 Computer Use, estaba optimizado principalmente para el control basado en navegador, lo que presentaba ciertas limitaciones. Google afirma que esta actualización proporcionará una ejecución más sensible para "tareas de automatización de larga duración y empresariales". Ante las preocupaciones de seguridad que podría generar el control total de los dispositivos por parte de la IA, Google ha introducido varias medidas. Esta función actualmente solo está disponible para desarrolladores y entornos empresariales, utilizada para automatizar pruebas de interfaces de usuario, realizar investigaciones en aplicaciones de sitios web o introducir datos automáticamente en software heredado. El acceso se realiza a través de la API de Gemini o la plataforma Gemini Enterprise Agent, y la versión para consumidores de la aplicación Gemini no puede activar esta función.

Captura de pantalla de la interfaz de una aplicación móvil que está siendo controlada activamente por el agente de IA Gemini 3.5.

En el ámbito de la seguridad, Gemini 3.5 Flash mantiene el protocolo de colaboración humano-máquina del modelo Gemini 2.5 Computer Use, garantizando que "operaciones sensibles" como transacciones financieras requieran autorización humana. Esta actualización añade dos nuevas funciones de seguridad. La primera es la detección automática de vectores de ataque, como "inyección indirecta de indicaciones", que detendrá la ejecución si se detectan indicaciones maliciosas ocultas en páginas web. La segunda es la exigencia de una confirmación explícita del usuario antes de ejecutar operaciones sensibles o irreversibles. Google señala que estas medidas de seguridad clave son configuraciones opcionales, y que los desarrolladores son responsables de utilizarlas, asumiendo todos los riesgos que surjan durante la operación.

Como parte del modelo nativo Gemini 3.5 Flash, la activación de la función Computer Use no tiene coste adicional. El precio de este nuevo modelo es de 1,50 dólares por cada millón de tokens de entrada, ligeramente superior a los 1,25 dólares del modelo Gemini 2.5. Sin embargo, la función de caché de contexto que ofrece el nuevo modelo puede reducir significativamente los costes generales, y para los desarrolladores que necesitan procesar grandes cantidades de tareas repetitivas, es probable que los beneficios compensen el ligero aumento del precio por token.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com