El motor central de DuMate, el asistente inteligente de Baidu, reduce el consumo de tokens de Agent en un 75%
2026-06-15 17:34
Favoritos

es.wedoany.com Noticia: El 15 de junio, DuMate, el asistente inteligente de Baidu, anunció la finalización de la actualización de su motor central. Esta actualización, mediante el motor Harness y múltiples optimizaciones continuas a nivel de ingeniería, ha logrado reducir el consumo de tokens durante la ejecución de tareas en un 75%, sin afectar la capacidad inteligente del Agent ni los resultados de la ejecución de tareas. En consecuencia, el consumo de puntos del usuario también se ha reducido en un 75%. Para los productos de agentes inteligentes a nivel empresarial, el consumo de tokens está directamente relacionado con el costo de uso, la eficiencia de respuesta a las tareas y la viabilidad de la implementación a gran escala. Esta actualización ha llevado la optimización de costos desde la capa de invocación del modelo hasta la capa de la cadena de ejecución del Agent.

DuMate es un producto de agente inteligente general de oficina y nivel empresarial lanzado por Baidu, orientado a escenarios como el procesamiento de archivos, la operación del navegador, la colaboración de Office, la recuperación de información, la descomposición de tareas y la ejecución entre herramientas. En comparación con los modelos de preguntas y respuestas comunes, la presión de costos de los productos Agent se concentra más en el proceso de ejecución de tareas: necesita comprender repetidamente la pantalla, invocar herramientas, leer el contexto, generar pasos de operación, verificar los resultados y continuar corrigiendo después de un fallo. Una tarea compleja a menudo no se completa con una sola invocación del modelo, sino que se forma mediante múltiples rondas de planificación, ejecución y verificación superpuestas. Cuanto mayor sea el consumo de tokens, más se amplificarán el tiempo de espera del usuario, el costo de inferencia de la plataforma y el consumo de puntos.

La clave de esta actualización del motor central reside en el motor Harness. Harness puede entenderse como la capa de ingeniería que conecta el modelo, las herramientas, el flujo de tareas y el entorno de ejecución del agente inteligente. Determina cómo el modelo descompone las tareas, cuándo invocar herramientas, cómo reutilizar el contexto, cómo comprimir pasos innecesarios y cómo replanificar después de un fallo en la tarea. Baidu mencionó anteriormente la capacidad de "ingeniería de control" en la actualización de sus productos de nube inteligente, enfatizando la mejora de la tasa de éxito de la ejecución de tareas de oficina y la reducción del consumo de tokens mediante la optimización de la ingeniería. El hecho de que DuMate haya reducido el consumo de tokens en un 75% indica que el enfoque de optimización se ha desplazado de la eficiencia de una sola ronda de preguntas y respuestas al control de costos de toda la ruta de ejecución de tareas del Agent.

Este tipo de optimización será más directa para la percepción del usuario. Cuando los empleados de una empresa utilizan el agente inteligente para manejar tareas como hojas de cálculo, documentos, búsqueda web, organización de materiales e ingreso de procesos, lo que realmente les importa es si la tarea se puede completar, si el tiempo de espera es aceptable y si el consumo de puntos es demasiado alto. Si el consumo de tokens para la misma tarea disminuye, el cálculo de costos durante las fases de prueba e implementación de la empresa será más claro, y los usuarios individuales también estarán más dispuestos a usar el Agent para tareas de oficina de alta frecuencia, en lugar de solo probarlo en unos pocos escenarios complejos. Para los productos de agentes inteligentes, la reducción de costos a menudo aumenta la frecuencia de uso, lo que a su vez genera más comentarios sobre tareas reales.

La industria de los Agent está pasando de la etapa de "si se puede hacer" a la de "si se puede completar de manera estable y a bajo costo". Los primeros productos de agentes inteligentes mostraban más la capacidad de control del navegador, operación de archivos y planificación de múltiples pasos, pero en el uso real eran propensos a problemas como el alto costo de tareas largas, pasos redundantes, expansión del contexto y alto consumo de reintentos después de fallos. El valor de la optimización de la capa Harness radica en permitir que el agente inteligente reduzca el pensamiento ineficaz y las invocaciones repetidas, y utilice la capacidad del modelo más para juicios clave, razonamiento complejo y verificación de resultados. A medida que los escenarios de oficina, marketing, servicio al cliente, I+D y operaciones continúen integrándose con los Agent, el costo de ejecución se convertirá en un indicador importante para la adquisición y el uso continuo por parte de las empresas.

Esta actualización de DuMate también refleja que el enfoque de la competencia en los productos de agentes inteligentes generales nacionales está cambiando. La capacidad del modelo sigue siendo la base, pero la experiencia del producto depende cada vez más del sistema de ingeniería, la orquestación de herramientas, la gestión del contexto y el control de costos. Quien pueda mantener la tasa de éxito de las tareas mientras reduce el consumo de tokens, tendrá más facilidad para ingresar a escenarios empresariales de alta frecuencia. Para Baidu, la actualización del motor central de DuMate ayuda a mejorar su competitividad de producto en el mercado de agentes inteligentes de oficina y Agent empresarial, y también sienta una base de costos para la posterior implementación local, la colaboración en equipo y la expansión a escenarios de la industria.

Queda por observar el rendimiento real de las tareas. Una reducción del 75% en el consumo de tokens es un indicador claro de optimización de costos, pero los usuarios empresariales también prestarán atención a la tasa de éxito de tareas complejas, la precisión del procesamiento de archivos, la estabilidad de la invocación de herramientas, la seguridad y privacidad, el control de permisos y la capacidad de colaboración multiusuario. Si DuMate puede mantener continuamente el efecto de ejecución en tareas de oficina de alta frecuencia y hacer que la reducción de costos se refleje realmente en los puntos del usuario y el presupuesto de la empresa, esta actualización no será solo un ajuste de parámetros, sino una verificación de la capacidad de ingeniería para que los agentes inteligentes generales avancen hacia un uso a gran escala.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com