La empresa china Unisound lanza el modelo grande U2, con una puntuación de 87,9 en GPQA Diamond Noticias Globales

La empresa china Unisound lanza el modelo grande U2, con una puntuación de 87,9 en GPQA Diamond

2026-06-08 13:38

Favoritos

es.wedoany.com Noticia: Unisound lanzó el 8 de junio de 2026 su nuevo modelo de lenguaje grande de nueva generación, U2. Este modelo está posicionado como un modelo grande nativo de agente, dirigido a individuos, desarrolladores y organizaciones. Su propuesta técnica se centra en una alta densidad de inteligencia y un alto valor de token, sin acumular parámetros o longitudes de salida de manera indiscriminada.

A diferencia de los modelos de lenguaje general tradicionales que se inclinan hacia la interacción de una sola ronda de preguntas y respuestas, U2 enfatiza la ejecución continua de tareas del mundo real. En escenarios como trabajo de oficina complejo, ingeniería de software, investigación profunda y colaboración con múltiples herramientas, U2 puede descomponer y avanzar de forma autónoma flujos de trabajo de más de 100 pasos, conectando la comprensión de necesidades, la planificación de tareas, la interacción con el entorno, el uso de herramientas, la corrección de procesos y la verificación de resultados en un bucle de ejecución cerrado, pasando de proporcionar respuestas a completar tareas.

imagen1

En cuanto a evaluaciones, U2 obtuvo una puntuación de 87,9 en GPQA Diamond, que mide el conocimiento y la capacidad de razonamiento complejo, superando a GLM-5.1, Hy3 preview, DeepSeek-V4-Flash (High) y MiniMax M2.7. En SWE-Bench Verified, que evalúa la capacidad de ingeniería de software, obtuvo una puntuación de 75, situándose entre los principales modelos. En la evaluación de extremo a extremo de agente autónomo Claw-Eval (pass@3), obtuvo 76,9, superando también a Hy3 preview, DeepSeek-V4-Flash (High) y MiniMax M2.7. En GDPval, que evalúa la capacidad de entrega en trabajo de oficina y conocimiento, obtuvo 72,9; este punto de referencia se centra en la finalización de tareas típicas de oficina como análisis de documentos, redacción de informes, procesamiento de hojas de cálculo, generación de gráficos y creación de presentaciones.

Unisound indicó que el diseño de U2 no se basa en ganar con una sola capacidad aislada, sino en ofrecer un rendimiento sistémico en razonamiento, programación, ejecución de agente y entrega de oficina. Para lograr los objetivos de ejecución de tareas, U2 introduce un mecanismo de pensamiento híbrido, que alterna dinámicamente entre cadenas de pensamiento explícitas y razonamiento en espacio latente según la etapa de la tarea, la complejidad y la incertidumbre durante el mismo proceso de razonamiento. En las etapas iniciales de la tarea, el modelo realiza búsqueda de rutas, descomposición de tareas y generación de planes candidatos en el espacio latente; en etapas de juicio crítico o manejo de restricciones, cambia al razonamiento explícito para la calibración lógica y la convergencia de resultados. Mediante la deducción latente acotada y el cambio basado en entropía, el modelo puede ajustar dinámicamente su modo de pensamiento según la incertidumbre en el proceso de razonamiento.

En la base de conocimiento, U2 aplica técnicas de filtrado y purificación de datos de alta densidad de conocimiento, eliminando datos duplicados y de baja calidad, y combina codificación de conocimiento disperso y una arquitectura de destilación de conocimiento para comprimir parámetros redundantes del modelo. En la capa de ejecución de tareas, se introduce un paradigma de entrenamiento colaborativo Agent-Harness, que integra la mejora de la capacidad del modelo y la optimización de la cadena de herramientas en el mismo bucle de entrenamiento, permitiendo que las trayectorias de ejecución de alta calidad generadas en tareas reales retroalimenten al modelo, mejorando sus capacidades en planificación, uso de herramientas, corrección de procesos y verificación de resultados.

U2 se centra en tres capacidades principales: razonamiento, programación y agente. En razonamiento, enfatiza la ejecución de baja desviación y la estabilidad lógica a largo plazo; en programación, se orienta a la entrega de ingeniería de extremo a extremo, capaz de generar código a partir de necesidades en lenguaje natural y comprender estructuras de proyectos con múltiples archivos; en capacidad de agente, se dedica a mejorar la colaboración con múltiples herramientas, la orquestación de flujos largos y la interacción con el entorno. Estas capacidades conforman un bucle cerrado de entrega de tareas que va desde la comprensión de necesidades, la planificación y ejecución, hasta la colaboración y verificación.

En cuanto a escenarios de aplicación, U2 puede cubrir el diseño de interfaces de espectro completo, incluyendo desarrollo web responsivo, construcción de aplicaciones web móviles e implementación de sistemas de diseño; investigación y análisis profundos, incluyendo investigación industrial y de políticas, análisis de datos visualizados y entrega de documentos en múltiples formatos; desarrollo de juegos interactivos inmersivos, como juegos casuales clásicos y simuladores físicos; y automatización de oficina eficiente, incluyendo análisis de informes comerciales, análisis de panorama industrial y revisiones periódicas de negocio. U2 ya está disponible en Token Hub de Unisound, abierto a individuos, desarrolladores y organizaciones.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com