es.wedoany.com Noticia: Con la acelerada iteración de las tecnologías de modelos de gran escala, el token, como unidad mínima de información de entrada y salida de estos modelos, está pasando de ser un término técnico detrás de escena a un concepto clave en la era de la economía inteligente. Según datos estadísticos de la Administración Nacional de Datos, hasta finales de marzo de 2026, el volumen diario de llamadas de tokens en China ha superado los 140 billones, un aumento de más de mil veces en comparación con principios de 2024. Los tokens se están convirtiendo cada vez más en un estándar central para medir la capacidad de servicio de los modelos, la eficiencia en el uso de la potencia computacional y la madurez de la industria. Un servicio de tokens de alta calidad conecta hacia abajo la optimización del entrenamiento y la inferencia de modelos, y hacia arriba impulsa la implementación de aplicaciones en miles de industrias, desempeñando un papel crucial para fortalecer la base de suministro de modelos de gran escala y liberar el valor de las aplicaciones de inteligencia artificial.
Para promover el desarrollo de alta calidad de los servicios de tokens en China, la Academia China de Tecnologías de la Información y la Comunicación (CAICT), en colaboración con 10 entidades, incluyendo Huawei Cloud, Ant Digital Technologies, Mobile Jiutian, Unicom Digital Intelligence, JD Cloud, Lenovo Baiying, Inspur Haiyue, Haowei Technology, Tianyun Data y Paiyun Cloud, ha lanzado conjuntamente el "Plan de Ascenso de Capacidad de Servicio de Tokens" (denominado "Plan de Ascenso"), y ha formulado y publicado la "Línea Base de Ascenso de Rendimiento de Servicio de Tokens para Escenarios Empresariales Generales".
Línea Base de Ascenso de Rendimiento de Servicio de Tokens para Empresas (Escenarios Generales) - Primera Edición
Tokens de salida por segundo (TPS) ≥ 55 tokens/segundo
Latencia del primer token (TTFT) ≤ 0.9 segundos
Tasa de éxito de llamadas ≥ 99.9%
Este "Plan de Ascenso" se centra en establecer referencias, mejorar el rendimiento, estabilizar el servicio, reducir costos y consolidar el ecosistema como direcciones clave. Aborda los principales desafíos y problemas comunes en el proceso de implementación ingenieril de los servicios de tokens. Combinando los datos de monitoreo de la "Plataforma de Monitoreo de Rendimiento de Servicios de Tokens para Modelos de Gran Escala" de la CAICT, proporciona referencias de rendimiento actualizadas dinámicamente cada trimestre para la industria, y publica periódicamente las empresas que alcanzan el "Plan de Ascenso", impulsando la actualización de los servicios de tokens desde "utilizables" a "fáciles de usar y asequibles".
El Instituto de Investigación en Inteligencia Artificial de la CAICT se ha dedicado durante mucho tiempo a la investigación de políticas, el desarrollo tecnológico, la formulación de estándares, la construcción de ecosistemas y las pruebas y evaluaciones en el campo de la inteligencia artificial. En el futuro, continuará impulsando el "Plan de Ascenso de Capacidad de Servicio de Tokens" para acelerar el desarrollo de alta calidad de los servicios de tokens.
Primero, se continuará convocando empresas para el ascenso, dando la bienvenida a más empresas para unirse y desafiar el "Plan de Ascenso", mejorando conjuntamente el rendimiento de los servicios de tokens en escenarios generales. Al mismo tiempo, la CAICT optimizará las herramientas y métodos de prueba de capacidad de servicio de tokens para garantizar el funcionamiento efectivo del mecanismo de actualización dinámica de la línea base de ascenso.
Segundo, se establecerán conjuntamente planes de ascenso a nivel industrial, colaborando con empresas líderes y proveedores de tecnología de diversas industrias para construir líneas base de ascenso de capacidad de servicio de tokens orientadas a escenarios verticales específicos de la industria, y definir rutas de ascenso.
Tercero, se proporcionará una evaluación integral de capacidades de pila completa para servicios de tokens de alta calidad. Por un lado, se continuará iterando y mejorando la plataforma de pruebas de rendimiento (TokenBenchX) y los conjuntos de datos de prueba especializados, ofreciendo evaluaciones de rendimiento integrales y profesionales para empresas de servicios de tokens. Por otro lado, en torno a todo el proceso de producción y operación de servicios de tokens, así como la calidad y seguridad del servicio, se proporcionará una evaluación de capacidades de pila completa para servicios de tokens.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









