X Square Robot de China publica un marco de código abierto para la recopilación de datos robóticos sin necesidad de robots físicos Noticias Globales

X Square Robot de China publica un marco de código abierto para la recopilación de datos robóticos sin necesidad de robots físicos

2026-06-15 14:19

Favoritos

es.wedoany.com Noticia: La empresa de robótica con sede en Shenzhen, X Square Robot, ha lanzado XRZero-G0, un conjunto de hardware y software de código abierto diseñado para recopilar datos de entrenamiento robótico a partir de operadores humanos, generar políticas y probarlas en robots reales. El código se distribuye bajo la licencia MIT y está alojado en GitHub junto con el conjunto de datos G0-Dataset.

Recopilación de datos robóticos sin robot

El enfoque tradicional depende de robots físicos para recopilar muestras de entrenamiento, y cada sesión de operación produce una cantidad extremadamente limitada de datos de demostración, lo que restringe directamente el tamaño de los conjuntos de datos necesarios para entrenar IA incorporada. Los demostradores humanos ofrecen una fuente de datos de menor costo, y X Square Robot ha integrado este método en un sistema de acceso público. La empresa desarrolla robots para escenarios de trabajo físico, donde anteriormente se requería una gran inversión de tiempo y dinero para operar manualmente los robots y recopilar muestras de entrenamiento.

Los robots físicos perciben su entorno a través de múltiples cámaras. Las cámaras montadas en la cabeza capturan escenas de gran alcance, mientras que las cámaras montadas en las muñecas registran con detalle las interacciones entre las manos y los objetos. Muchos dispositivos de recopilación de operación manual dependen únicamente de la vista de la muñeca, lo que provoca una discrepancia entre los datos de entrenamiento y la forma en que el robot percibe durante su despliegue real. XRZero-G0 utiliza una cámara montada en la cabeza y dos cámaras de muñeca para registrar simultáneamente el contexto amplio de la escena y las operaciones finas de cerca, y mapea estas perspectivas en una representación compartida que coincide con la percepción del robot. Combinado con una interfaz VR portátil y pinzas intercambiables, un solo operador puede generar datos de demostración aplicables a diferentes cuerpos robóticos.

Los datos provenientes de demostradores humanos presentan problemas de calidad que pueden afectar su valor de entrenamiento. XRZero-G0 construye un flujo de trabajo cerrado que incluye recopilación, inspección, entrenamiento y evaluación para filtrar las muestras que ingresan a la fase de entrenamiento. A nivel de observación, las restricciones de consistencia geométrica multivista reducen la desalineación entre imágenes y movimiento; a nivel cinemático, un algoritmo de cinemática inversa de cuerpo completo con restricciones de colisión y límites articulares elimina trayectorias inválidas; a nivel de política, la reproducción en el robot físico sirve como validación final. Según informa X Square Robot, en condiciones controladas, la tasa de producción efectiva de datos del sistema se acerca al 85%.

La empresa señala que los datos sin robot y los datos de robots reales pueden trabajar de manera sinérgica. Combinar aproximadamente 10 fragmentos de demostración recopilados por humanos con 1 fragmento registrado por un robot real logra un rendimiento comparable en tareas de prueba al de un conjunto de entrenamiento compuesto completamente por datos de robots reales. Los datos recopilados por humanos proporcionan una amplia cobertura de comportamiento, mientras que una pequeña cantidad de datos de robots reales se utiliza para anclar parámetros físicos como el retardo del motor y la fricción. En condiciones de prueba, esta proporción reduce la necesidad de datos de robots reales hasta en 20 veces.

El conjunto de datos G0-Dataset contiene más de 2000 horas de demostraciones validadas, que abarcan modalidades visuales, táctiles y auditivas, e incluye 3000 tareas de manipulación diferentes, con una distribución que sigue características de cola larga. La velocidad máxima de recopilación de datos por parte del operador alcanza los 93.2 fragmentos por hora. Este conjunto de datos admite estudios de preentrenamiento a gran escala y transferencia entre diferentes cuerpos robóticos. X Square Robot afirma que las políticas entrenadas con este marco pueden generalizarse a entornos de recopilación con diferentes posturas robóticas, alturas de mesa y perspectivas, y muestran capacidad de transferencia de disparo cero a plataformas robóticas fuera del conjunto de entrenamiento, ejecutando tareas sin necesidad de ajuste fino para la nueva plataforma.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com