es.wedoany.com Noticia: NVIDIA y el Instituto de Investigación de Inteligencia Artificial de Pekín (BAAI) han enviado señales sincronizadas recientemente: la IA está pasando del mundo digital al mundo físico, y los datos, los modelos del mundo y la simulación se están convirtiendo en los elementos centrales que impulsan este proceso. El CEO de NVIDIA, Jensen Huang, señaló en la junta general anual de accionistas del 25 de junio de 2026 que los centros de datos de IA son fábricas que "producen tokens", y cada token puede transformarse en código, respuestas, diseños, acciones y servicios. Los clientes no solo compran servidores, sino fábricas de IA capaces de generar ingresos. Enfatizó que la IA física es la próxima ola de crecimiento, y que los robots, los automóviles y las fábricas se convertirán en agentes inteligentes en el mundo real. NVIDIA entrenará modelos a través de fábricas de IA, los simulará con Omniverse y los implementará en dispositivos físicos a través de plataformas como Jetson. Casi al mismo tiempo, el Instituto de Investigación de Inteligencia Artificial de Pekín incluyó los modelos del mundo como una dirección de consenso importante hacia la Inteligencia Artificial General (AGI), proponiendo pasar de "predecir el siguiente token" a "predecir el siguiente estado del mundo".
El núcleo de los modelos del mundo es permitir que la IA perciba, comprenda y razone sobre el tiempo, el espacio y las leyes físicas del mundo real, abarcando datos multimodales completos y poseyendo capacidad de interacción activa. La profesora de Stanford, Fei-Fei Li, señaló que la inteligencia espacial es la capacidad de las máquinas para percibir, razonar y actuar en el espacio 3D y el tiempo. Su empresa fundada, World Labs, completó recientemente una financiación de 1.000 millones de dólares, con una valoración de 5.000 millones de dólares. Fei-Fei Li opina: los grandes modelos enseñan a las máquinas a leer y escribir, mientras que la inteligencia espacial les enseña a observar y construir.
La pista global de los modelos del mundo se está llenando rápidamente, cubriendo desde la conducción autónoma en exteriores, espacios urbanos exteriores hasta escenarios de espacios interiores. En el campo de la conducción autónoma, Momenta lanzó en abril de 2026 el modelo del mundo R7 en producción en serie, basándose en más de 12.000 millones de kilómetros de datos de conducción real para que el sistema pueda predecir el mundo; Li Auto lanzó MindVLA-o1, definiendo la conducción autónoma como el punto de partida de la IA física. En escenarios de interiores y hogares, Ezviz lanzó su propio "Modelo del Mundo Ezviz Xingchen", y su robot aspirador-fregador de IA construye mapas semánticos 3D del hogar para predecir los movimientos de mascotas y peatones; Daxiao Robotics, en colaboración con la Universidad China de Hong Kong (CUHK), lanzó Kairos-HomeWorld, el primer modelo del mundo del mundo capaz de generar toda la casa e interactuar con todos los objetos, y ha abierto simultáneamente un conjunto de datos de 300.000 planos de viviendas reales chinos y 5.000 escenarios de simulación. En el campo de la arquitectura y BIM, el gigante global del software de diseño Autodesk realizó una inversión estratégica en World Labs, impulsando la IA física de "comprender datos" a "comprender la arquitectura"; el equipo de Fei-Fei Li lanzó en junio de 2026 la tecnología World Tracing, que puede recuperar la geometría 3D completa a partir de una sola foto de un edificio. En el ámbito de espacios exteriores y urbanos, Amap lanzó en junio de 2026 el primer modelo del mundo urbano 3D nativo del mundo, ABot-Earth0.5, que cubre más de 190 países y regiones. Con solo 10 minutos de entrada de imágenes satelitales, puede generar escenas urbanas 3D a escala kilométrica en una GPU de consumo, con un costo de solo el uno por ciento de los métodos tradicionales; Baidu integró las capacidades del modelo del mundo en su gran modelo ERNIE 5.0 y en el sistema de conducción autónoma Apollo; Google DeepMind conectó 280.000 millones de imágenes de Street View que cubren 110 países del mundo al modelo del mundo Genie, permitiendo a los usuarios generar entornos interactivos basados en ubicaciones reales. En el campo de la inteligencia espacial de interiores, a nivel internacional se encuentran Mappedin, la plataforma de mapas de interiores más grande del mundo, que utiliza IA y tecnología LiDAR para convertir planos de edificios en mapas digitales 3D dinámicos, cubriendo ya más de 10.000 millones de pies cuadrados de espacio interior en 86 países; NavVis, un proveedor alemán de soluciones de inteligencia espacial de interiores fundado en 2013, que presta servicios a empresas como Daimler y Huawei a través de sistemas de escaneo móvil y plataformas de gemelos digitales; VergeSense, que lanzó el Large Spatial Model (LSM), basado en datos de comportamiento de más de 200 millones de pies cuadrados de espacio de oficinas recopilados durante ocho años para predecir patrones de comportamiento humano; Vestella Labs, una empresa de inteligencia espacial centrada en la IA física, cuya tecnología central puede convertir automáticamente información espacial no estructurada (como imágenes, PDF, planos CAD) en datos espaciales comprensibles para la IA. A nivel nacional se encuentra Shuwei Tech, que ha establecido una base de datos de información espacial de interiores de China mediante recopilación de campo en modo colaborativo y anotación técnica automática, actualizada continuamente durante diez años. Realiza anotaciones multimodales continuas y punto por punto (visual, textual, huella inalámbrica, etc.) de espacios urbanos accesibles para peatones, como espacios interiores complejos, generando finalmente conjuntos de datos multimodales a gran escala.
Los datos de la industria muestran que el mercado chino de la IA física fue de aproximadamente 915.000 millones de yuanes en 2025, y se espera que supere los 1.090,4 billones de yuanes en 2026; el mercado global de navegación y posicionamiento en interiores fue de 16.900 millones de dólares en 2025 y se espera que alcance los 72.460 millones de dólares en 2032, con una tasa de crecimiento anual compuesta del 23,11%; el mercado global de BIM fue de aproximadamente 9.500 millones de dólares en 2025 y se espera que alcance los 32.500 millones de dólares en 2036. Los actores líderes de la industria ya se han dado cuenta de que la barrera definitiva de los modelos del mundo está en los datos, no en los algoritmos. El 90% de la vida, el trabajo y el consumo de los humanos ocurren en interiores. Ya sea que los robots físicos entren en los hogares, los electrodomésticos inteligentes comprendan la distribución del hogar, o las empresas tomen decisiones comerciales offline, la inteligencia espacial de interiores es una capacidad central indispensable. Esta es precisamente la parte más valiosa y difícil de obtener de la base de datos de los modelos del mundo.

La competencia de los modelos del mundo es esencialmente ya una competencia por la base de datos, y el núcleo de la base de datos son los datos de espacios interiores reales, de grano fino y comercializables. Cuando Jensen Huang anuncia que la IA física es la próxima ola de crecimiento, cuando Amap reconstruye ciudades 3D, Momenta predice las condiciones del tráfico y Ezviz permite que los robots "comprendan" el hogar, cada dirección clama por datos espaciales reales, precisos y escalables. La IA está aprendiendo a "imaginar" el mundo físico, y lo que evita que esta imaginación se desvíe de la realidad y hace que los modelos del mundo sean realmente utilizables son los ladrillos y el mortero del mundo real, cada persona y cada lugar, cada entrada y cada salida.










