GSMA de Francia desarrolla un corpus de telecomunicaciones con más de 10 mil millones de tokens para corregir deficiencias en modelos de IA
2026-06-26 10:17
Favoritos

es.wedoany.com Noticia: La Asociación Global de Sistemas de Comunicaciones Móviles (GSMA), en colaboración con la organización francesa de infraestructura Pleias, ha desarrollado el "Corpus Común de Telecomunicaciones" (Telco Common Corpus), que contiene más de 10 mil millones de tokens de datos y compilaciones técnicas relacionadas con las telecomunicaciones, con el objetivo de abordar las carencias de los modelos de IA existentes en el ámbito de las telecomunicaciones.

La GSMA señala que las evaluaciones comparativas y las plataformas de trabajo actuales para la IA han revelado deficiencias en múltiples áreas, incluida la gestión de redes. Por ello, la asociación, junto con Pleias, impulsa este proyecto de corpus para subsanar estas carencias.

Este corpus se pondrá a disposición de forma gratuita, ofreciendo literatura técnica, patentes, datos abiertos y proyectos de red. La GSMA explica que esta información es difícil de obtener directamente mediante métodos de investigación tradicionales, y los intentos de uso de los modelos de vanguardia actuales suelen limitarse a áreas no relacionadas con las telecomunicaciones.

La GSMA se compromete a que este corpus proporcionará los datos de entrenamiento abiertos necesarios para que la industria construya modelos de alto rendimiento e infraestructura de datos abiertos. Todos los materiales han sido verificados, y el proyecto se considera el primer intento de integrar un "sistema de conocimiento público de las telecomunicaciones". La GSMA enfatiza que los modelos generales y de vanguardia siguen siendo débiles en tareas relacionadas con la operación de redes reales, como la corrección de problemas o el razonamiento utilizando los procesos del Proyecto de Asociación de Tercera Generación (3GPP). Este corpus busca resolver estos problemas proporcionando datos de entrenamiento para modelos especializados en telecomunicaciones y generando datos específicos basados en reglas heurísticas de telecomunicaciones, en lugar de una recopilación aleatoria de datos.

Además, la GSMA indica que este corpus evolucionará con la publicación de nuevos materiales, lo que ayudará a satisfacer las crecientes demandas de trazabilidad de fuentes, beneficiando así a operadores, fabricantes de equipos, instituciones de investigación y organismos reguladores.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com