Google de EE. UU. lanza el algoritmo TurboQuant, la eficiencia de memoria de IA aumenta 8 veces y los costos se reducen en más del 50% Noticias Globales - Wedoany.com

Inicio Noticias Detalles

Google de EE. UU. lanza el algoritmo TurboQuant, la eficiencia de memoria de IA aumenta 8 veces y los costos se reducen en más del 50%

2026-03-27 10:12

Favoritos

El departamento de investigación de Google ha lanzado recientemente el conjunto de algoritmos TurboQuant, un avance de software dirigido a los cuellos de botella de memoria en los modelos de lenguaje grandes. Este algoritmo reduce el uso de memoria del modelo en un promedio de 6 veces mediante una compresión extrema de la caché clave-valor, y mejora el rendimiento en 8 veces al calcular la atención, lo que podría reducir los costos operativos de las empresas en más del 50%. El documento de investigación relacionado se ha publicado gratuitamente y se puede aplicar sin necesidad de entrenamiento.

Basado en marcos matemáticos como PolarQuant y la cuantificación Johnson-Lindenstrauss, TurboQuant reduce efectivamente el error de cuantificación mediante un procesamiento en dos etapas. En pruebas con modelos como Llama-3.1-8B y Mistral-7B, el algoritmo redujo la huella de memoria al menos 6 veces manteniendo el rendimiento, y logró una aceleración de 8 veces en hardware como NVIDIA H100.

La comunidad ha reaccionado con entusiasmo. El analista técnico @Prince_Canuma probó el modelo Qwen3.5-35B en MLX, y los informes muestran que TurboQuant de 2,5 bits redujo la caché KV casi 5 veces sin pérdida de precisión. El usuario @NoahEpstein_ señaló que este algoritmo reduce la brecha entre la IA local y los servicios en la nube, permitiendo que el hardware de consumo maneje contextos más largos.

En cuanto al mercado, las acciones de los proveedores de memoria han mostrado una tendencia a la baja, reflejando la expectativa de que la demanda de memoria de alto ancho de banda podría moderarse. Para las empresas, TurboQuant ofrece una oportunidad de mejora inmediata, optimizando las canalizaciones de inferencia, ampliando la capacidad de procesamiento de contexto y mejorando las implementaciones locales, sin necesidad de volver a entrenar los modelos.

Google optó por lanzar TurboQuant antes de las conferencias ICLR 2026 en Río de Janeiro, Brasil, y AISTATS 2026 en Tánger, Marruecos, marcando la transición de la teoría académica a la aplicación en producción. Este algoritmo proporciona una infraestructura de memoria eficiente para la era de la IA agente, y podría impulsar a la industria hacia una dirección de "mejor memoria".

Información y comunicación Ingeniería de Inteligencia Artificial

Anterior：Perú confirma sistema geotérmico en el sur de los Andes y surge potencial energético en frontera con Chile

Posterior：La startup de IA respaldada por NVIDIA, Reflection, negocia una financiación de 25 mil millones de dólares, con una posible valoración de 250 mil millones

Pinming Technology Co., Ltd.

Xinshiqi Vehículo autónomo X3 con caja de carga

Neolix Beijing Technology Co., Ltd.

Productos de sistemas de multiplexación por división de longitud de onda (WDM)

Shenzhen SDG Information Co., Ltd.

Sistema de monitoreo inteligente de cinta transportadora

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Conmutador rápido de fuente de alimentación redundante QPS-20A

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

Software del servidor de aplicaciones Baolande V9.5

Beijing Baolande Software Corporation

TWP16 Radar de perfil de viento troposférico en banda P

China Huayun Meteorological Technology Group Co., Ltd.

Red de área local inalámbrica | Punto de acceso AirEngine 5776-56T

Terminal satelital portátil de placa plana de 0,35 m de diámetro (manual)

China Starwin Science & Technology co., Ltd.

SIS Soluciones de Instrumentación de Seguridad

Beijing Consen Automation Technology Co., Ltd.

Lámina de silicona termoconductora ABT-CP815

Dongguan Aobote Thermal Technology Co., Ltd.

Subarray Tx de antena de arreglo en fase banda Ka

COXSAT TECHNOLOGY CO., LTD.

Recomendaciones

Umovity y Tatweer implementan un sistema adaptativo de regulación de rampas en Abu Dabi, Emiratos Árabes Unidos

Era0 de Robotera encabeza el ranking mundial de inteligencia encarnada de RoboChallenge

El asistente de IA a nivel de sistema operativo de Tencent, "Mavis", se lanza oficialmente, disponible simultáneamente en Windows, Mac y Android

Microsoft eliminará gradualmente la autenticación de dos factores por SMS y promoverá las claves de acceso

DataXight de EE. UU. lanza protoXell para extraer información mecanicista de datos de perturbación a gran escala y acelerar el descubrimiento de dianas y el reposicionamiento de fármacos

Informatica de EE. UU. presenta en Informatica World 2026 la Gestión de Datos Headless y la Gestión Inteligente de Datos Maestros, construyendo una base de datos confiable para agentes de IA en todas las plataformas

Acceldata de EE. UU. lanza una plataforma autónoma de datos e IA para la era de la IA agéntica; su CEO declara el inicio de la era post-lakehouse

El Ministerio de Industria y Tecnología Informática de China despliega medidas para estabilizar el empleo: la industria ligera y textil como "lastre", y lanza simultáneamente un plan de apoyo al emprendimiento para pequeñas y medianas empresas de inteligencia artificial

Nvidia de EE. UU. planea liderar una ronda de 20 millones de dólares en la startup india de IA Simplismart, con una valoración de 100 millones de dólares

El presidente del CCPIT, Ren Hongbin, se reúne con Lisa Su de AMD; la cooperación en capacidad de cómputo y las actividades empresariales de APEC centran la atención

Últimos boletines

1911 Gold inicia el desarrollo de galerías en el nivel 16 de la mina True North en Canadá, con producción prevista para 2027

El proyecto CCS de Moomba de Santos en Australia almacena 2 millones de toneladas de CO₂

Marimaca Copper avanza en permisos y estrategia de ácido sulfúrico para proyecto de depósito de óxidos en Chile

20 de mayo: La internacionalización de la ingeniería energética: hidrógeno verde, microrredes, transmisión eléctrica, almacenamiento de energía e infraestructura energética en el extranjero como líneas principales

Statkraft planea invertir otros 80.000 millones de coronas noruegas en energía hidroeléctrica en Noruega

Moment Energy de Canadá obtiene el primer sistema de gestión de baterías con certificación UL

Panamá inaugura el primer laboratorio universitario de módulos fotovoltaicos

El proyecto alemán Spirit-E demuestra por primera vez la carga bidireccional de camiones eléctricos en logística real

Targa Exploration descubre vetas de oro y plata en el proyecto El Zanjón, Argentina

BHP avanza en su estrategia en San Juan, Argentina: enfoque en exploración intensiva y adquisiciones selectivas