JD y organizaciones de investigación presentan la tecnología RLSD para reducir el costo de entrenamiento de modelos de inferencia de IA Noticias Globales - Wedoany.com

Inicio Noticias Detalles

JD y organizaciones de investigación presentan la tecnología RLSD para reducir el costo de entrenamiento de modelos de inferencia de IA

2026-04-29 15:15

Favoritos

es.wedoany.com Noticia: El alto costo del entrenamiento de modelos de inferencia de IA ha sido durante mucho tiempo un desafío para los equipos empresariales. Investigadores de JD, en colaboración con varias instituciones académicas, han propuesto un nuevo paradigma de entrenamiento llamado RLSD, diseñado para construir agentes de inferencia personalizados con menos recursos computacionales. Esta tecnología combina el aprendizaje por refuerzo con la autodestilación, resolviendo los problemas de señales escasas o altos costos computacionales presentes en los métodos tradicionales.

rlvr

En los experimentos, los modelos entrenados con RLSD alcanzaron una precisión promedio del 56,18 % en múltiples pruebas de referencia de inferencia visual, superando al modelo base y al método estándar RLVR. Yang Chenxu, coautor del artículo, explicó que RLSD desacopla la dirección y la magnitud de la actualización, utilizando señales de recompensa verificables para determinar la dirección y logrando una retroalimentación detallada a nivel de token mediante la autodestilación. Esto evita problemas de fuga de información y mantiene la estabilidad del entrenamiento.

RLSD solo requiere una propagación hacia adelante adicional, con una velocidad de convergencia aproximadamente el doble de rápida que los métodos tradicionales. Es adecuado para tareas con recompensas verificables, como la compilación de código o la verificación matemática, y puede aprovechar de manera flexible la información privilegiada. Esta tecnología puede integrarse de forma ligera en los marcos de código abierto existentes, ofreciendo a las empresas una nueva vía para optimizar modelos utilizando datos internos.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com

Información y comunicación Ingeniería de Inteligencia Artificial

Anterior：Delegación Nórdico-Báltica en Estambul impulsa el transporte inteligente en Turquía

Posterior：The Housing Finance Corporation del Reino Unido se compromete a destinar 550 millones de libras para el desarrollo de viviendas asequibles en tres regiones

Terminal satelital portátil de placa plana de 0,35 m de diámetro (manual)

China Starwin Science & Technology co., Ltd.

Software del servidor de aplicaciones Baolande V9.5

Beijing Baolande Software Corporation

Xinshiqi Vehículo autónomo X3 con caja de carga

Xinshiqi Huitong (Beijing) Technology Co., Ltd.

Sistema de monitoreo inteligente de cinta transportadora

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Pinming Technology Co., Ltd.

Productos de sistemas de multiplexación por división de longitud de onda (WDM)

Shenzhen SDG Information Co., Ltd.

SIS Soluciones de Instrumentación de Seguridad

Beijing Consen Automation Technology Co., Ltd.

Subarray Tx de antena de arreglo en fase banda Ka

COXSAT TECHNOLOGY CO., LTD.

TWP16 Radar de perfil de viento troposférico en banda P

China Huayun Meteorological Technology Group Co., Ltd.

Conmutador rápido de fuente de alimentación redundante QPS-20A

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

Lámina de silicona termoconductora ABT-CP815

Dongguan Aobote Thermal Technology Co., Ltd.

Recomendaciones

Majestic Labs lanza el servidor de IA Prometheus con 128 TB de memoria en una sola unidad, rompiendo el cuello de botella de la memoria

Poolside, de Estados Unidos, lanza el modelo de programación de código abierto Laguna XS.2

Eino lanza en EE. UU. una plataforma de observabilidad para redes de agentes

Blaize, Nokia y Datacomm despliegan IA híbrida en Indonesia

RFOptic lanza un enlace de fibra RF de 8 GHz compatible con 5G y banda C

u-blox lanza el módulo GNSS ZED-X20P-01B con precisión de nivel decimétrico

SouthernCrossAI se une a Equinix Fabric AI para desplegar nodos de inferencia de IA soberana en Australia basados en SambaNova SN50

La UE planea centrar su regulación digital en los servicios en la nube y la inteligencia artificial

JD y organizaciones de investigación presentan la tecnología RLSD para reducir el costo de entrenamiento de modelos de inferencia de IA

Hefei pone en funcionamiento la primera estación demostrativa de interacción vehículo-red de China con "5G + cifrado cuántico" para respaldar la descarga inversa V2G y la carga flash de megavatios

Últimos boletines

Puente ferroviario sobre el río Sabarmati en India completa las obras de cimentación e inicia la construcción de la superestructura

Majestic Labs lanza el servidor de IA Prometheus con 128 TB de memoria en una sola unidad, rompiendo el cuello de botella de la memoria

Una nueva vía para la inteligencia artificial en la automatización industrial: potenciar los sistemas existentes en lugar de reemplazarlos

Poolside, de Estados Unidos, lanza el modelo de programación de código abierto Laguna XS.2

Eino lanza en EE. UU. una plataforma de observabilidad para redes de agentes

Accenture invierte en la estadounidense General Robotics para acelerar las operaciones autónomas con IA

El avión chino C909 opera su segunda ruta regular en Asia Central

El transmisor acústico inalámbrico de Emerson permite el monitoreo en línea de válvulas

Hormel Foods completa la venta de su negocio de pavo entero a Life Science Innovations

Finalizan las obras de la carretera Birdsert-Bentley en Australia: ampliación de dos a cuatro carriles