es.wedoany.com Noticia: El 12 de junio, se celebró en Pekín la octava Conferencia de Inteligencia Artificial de Pekín (BAAI Conference). El Instituto de Investigación de Inteligencia Artificial de China (BAAI) presentó el modelo base universal del mundo, Wujie·Physis-v0.1. Este modelo está diseñado para modelar el mundo físico real, enfatizando la corrección física, la causalidad de las acciones rastreable, la consistencia a largo plazo y la capacidad de generalización universal. Puede adaptarse a escenarios de aplicación física real como robótica, generación de video, juegos e industria, proporcionando soporte subyacente para la inteligencia incorporada y los sistemas de inteligencia industrial.
Este lanzamiento sitúa el modelo del mundo en una posición más fundamental. Los grandes modelos de lenguaje son expertos en comprensión y razonamiento de texto, y los modelos multimodales conectan aún más imágenes, voz y video. Sin embargo, la robótica, la simulación industrial, la conducción autónoma, la fabricación inteligente y las tareas espaciales complejas no solo requieren "entender la imagen", sino también comprender cómo se mueven los objetos, cómo las acciones producen resultados y si los cambios ambientales se ajustan a las leyes físicas. El posicionamiento de Wujie·Physis-v0.1 es precisamente extender la capacidad del modelo desde la generación de contenido digital hacia la predicción e interacción con el mundo físico.
La dificultad de los modelos del mundo radica en la continuidad. Un clip de video puede verse claro, pero si el movimiento del objeto no se ajusta a la gravedad, las relaciones de colisión son inconsistentes o la causalidad de las acciones no se puede rastrear, es difícil que sirva para escenarios robóticos e industriales reales. Para la inteligencia incorporada, el robot necesita juzgar las consecuencias de una acción antes de ejecutarla; para aplicaciones industriales, el modelo debe mantener una deducción consistente en procesos de producción, operación de equipos, cambios de materiales y restricciones espaciales. Physis-v0.1 enfatiza la consistencia a largo plazo y la causalidad rastreable, lo que indica que el objetivo del modelo no es solo generar imágenes más realistas, sino respaldar un razonamiento físico verificable, ejecutable y transferible.
El BAAI también presentó simultáneamente otros logros, incluido el gran modelo multimodal de neurociencia Wujie·Brainμ1.0, así como avances en agentes, ecosistema de software y hardware básico, y construcción de ecosistema de código abierto. Esto hace que el sistema "Wujie" muestre un diseño multidireccional más claro: un extremo se orienta hacia el mundo físico y la inteligencia incorporada, otro conecta con la neurociencia y las ciencias de la vida, y el otro extremo respalda la expansión de aplicaciones a través de agentes y el ecosistema de software y hardware. Para las instituciones de investigación básica en inteligencia artificial, esta combinación significa que el enfoque de la investigación está pasando de la capacidad de un solo modelo a la construcción sistemática de modelos, datos, agentes, plataformas y ecosistemas de código abierto.
Physis-v0.1 es particularmente importante para la industria robótica. Actualmente, los robots humanoides y los robots móviles manipuladores ya pueden realizar tareas como agarre, transporte, inspección y preparación de pedidos en farmacias, pero lo que realmente limita su implementación a gran escala es la estabilidad a largo plazo y la capacidad de generalización en entornos complejos. Los robots no pueden depender únicamente de programas predefinidos para actuar en escenarios fijos; necesitan comprender las relaciones entre mesas, estantes, herramientas, puertas, líquidos, objetos flexibles y acciones humanas. Si un modelo universal del mundo puede proporcionar capacidades de predicción física más confiables, ayudará a los robots a reducir los costos de prueba y error en entrenamiento, simulación, planificación de tareas y recuperación de anomalías.
En el ámbito industrial, el modelo del mundo también podría convertirse en una nueva base para gemelos digitales y fabricación inteligente. La simulación industrial tradicional generalmente depende de reglas, parámetros y modelos de ingeniería explícitos, adecuados para equipos o procesos específicos, pero con capacidad limitada para la transferencia entre escenarios. Si un modelo base universal del mundo puede aprender las leyes comunes en diferentes sistemas físicos, en el futuro podría usarse para la planificación de líneas de producción, la deducción del estado de los equipos, la optimización de parámetros de proceso, la comprensión de video industrial y la predicción de riesgos de seguridad. Para las empresas manufactureras, el valor de este tipo de modelo no es solo "generar imágenes", sino ayudar al sistema a predecir de antemano las consecuencias de una acción, proceso o cambio ambiental.
Los escenarios de juegos y generación de video ofrecen otra vía de verificación. La generación de contenido de alta calidad requiere imágenes realistas, pero la generación más avanzada necesita coherencia en el proceso físico, como la consistencia continua en movimientos de personajes, colisiones de objetos, cambios de luz y sombra, flujo de líquidos, movimientos mecánicos y relaciones espaciales. Si Physis-v0.1 puede mantener la plausibilidad física en estos escenarios, impulsará la producción de contenido desde la generación de clips cortos hacia la generación de mundos virtuales interactivos, controlables y en evolución sostenida. Esto también permitirá que el modelo del mundo sirva simultáneamente a la industria de contenido digital y al sistema de entrenamiento de inteligencia incorporada.
Este lanzamiento también tiene implicaciones para el ecosistema de código abierto. El BAAI ha estado promoviendo durante mucho tiempo la construcción en torno a grandes modelos, conjuntos de datos, sistemas de evaluación y plataformas tecnológicas de código abierto. Si el modelo universal del mundo se vincula con datos abiertos, plataformas de evaluación, marcos de agentes y el ecosistema de software y hardware básico, ayudará a reducir la barrera de entrada para universidades, instituciones de investigación y equipos industriales en la investigación de modelos del mundo. Para la industria de IA de China, la capacidad de los modelos básicos requiere avances de equipos líderes, pero también necesita un ecosistema abierto que permita a más desarrolladores formar validaciones de aplicaciones en torno a robótica, industria, investigación científica y generación de contenido.
Los próximos hitos se centran principalmente en tres aspectos: primero, si Wujie·Physis-v0.1 abrirá modelos, datos, interfaces o herramientas de evaluación para que equipos externos puedan verificar su consistencia física y capacidad de generalización; segundo, si las aplicaciones piloto en escenarios como robótica, industria, juegos y generación de video formarán casos reproducibles; tercero, si modelos de neurociencia como Wujie·Brainμ1.0 pueden establecer una conexión más profunda con el sistema de modelos del mundo, impulsando la IA desde la inteligencia lingüística y visual hacia la investigación interdisciplinaria del mundo físico y las ciencias de la vida. Si estas direcciones continúan avanzando, este lanzamiento del BAAI no será solo una actualización de modelo, sino que podría convertirse en un hito importante en la construcción del sistema de tecnología subyacente de modelos universales del mundo e inteligencia incorporada en China.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









