Longsys de China ejecuta un modelo de 397B en la plataforma AMD Ryzen AI Noticias Globales - Wedoany.com

Inicio Noticias Detalles

Longsys de China ejecuta un modelo de 397B en la plataforma AMD Ryzen AI

2026-06-21 11:13

Favoritos

es.wedoany.com Noticia: AMD lanzó recientemente su plataforma Ryzen AI Halo a un precio de 4000 dólares, lo que ha generado comparaciones con el producto DGX Spark, ligeramente más caro de NVIDIA. La empresa de almacenamiento y memoria Longsys ha ido un paso más allá, demostrando la ejecución local de un modelo de IA con 397 mil millones de parámetros en esta plataforma. La demostración utiliza un procesador Ryzen AI Max+ 395 de 16 núcleos con 128 GB de memoria, logrando una compresión de datos en tiempo real mediante su SPU autodesarrollada y la configuración iSA. Esto permite que el dispositivo ejecute un modelo que normalmente requiere entre 200 y 250 GB de memoria de video, utilizando solo 128 GB de memoria unificada (de los cuales 96 GB están disponibles para la GPU).

AMD Ryzen AI

Se especula que este modelo es una versión personalizada derivada de Qwen 3.5 397B (A17B) de Alibaba, que utiliza un enfoque de mezcla de expertos (MoE). Incluso con cuantificación INT4, sus requisitos de memoria superan con creces la memoria disponible del dispositivo de demostración. Longsys afirma que su método utiliza descarga de expertos, gestión inteligente de caché y algoritmos de precarga predictiva para descargar expertos inactivos de la DRAM a un búfer de almacenamiento rápido y grande, permitiendo que el chip de IA los recargue cuando sea necesario. Este enfoque busca abordar problemas como la gran cantidad de parámetros en los modelos MoE de lenguaje grande, la rápida expansión de la caché KV y la latencia de E/S. La empresa afirma que, al utilizar una capa de caché para reducir la demanda de DRAM, se puede duplicar la cantidad de datos almacenados en unidades de hasta 128 GB. Cabe destacar que Longsys no proporcionó detalles sobre la potencia de cálculo medida en tokens por segundo, ya que el chip Ryzen AI es relativamente limitado en este aspecto en comparación con la mayoría de los productos modernos de GPU para IA. No obstante, este enfoque de tratar el almacenamiento como memoria sugiere que, al aprovechar el almacenamiento rápido, se pueden eludir las limitaciones de memoria, permitiendo que modelos de primer nivel que normalmente requieren hardware de IA costoso se ejecuten en dispositivos del tamaño de la palma de la mano.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com

Información y comunicación Ingeniería de procesamiento inteligente de datos Ingeniería de Inteligencia Artificial

Anterior：Un vehículo submarino avanzado de Noruega inicia su primera misión de cartografía del fondo marino

Posterior：Avisa App de Brasil presenta su servicio de marketing por WhatsApp en Web Summit Rio

Lámina de silicona termoconductora ABT-CP815

Dongguan Aobote Thermal Technology Co., Ltd.

Xinshiqi Vehículo autónomo X3 con caja de carga

Neolix Beijing Technology Co., Ltd.

Solución de prevención de fugas de datos en oficina

Sangfor Technologies Inc.

SIS Soluciones de Instrumentación de Seguridad

Beijing Consen Automation Technology Co., Ltd.

Subarray Tx de antena de arreglo en fase banda Ka

COXSAT TECHNOLOGY CO., LTD.

Sistema de monitoreo inteligente de cinta transportadora

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Productos de sistemas de multiplexación por división de longitud de onda (WDM)

Shenzhen SDG Information Co., Ltd.

Pinming Technology Co., Ltd.

Terminal satelital portátil de placa plana de 0,35 m de diámetro (manual)

China Starwin Science & Technology co., Ltd.

Red de área local inalámbrica | Punto de acceso AirEngine 5776-56T

Conmutador rápido de fuente de alimentación redundante QPS-20A

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

TWP16 Radar de perfil de viento troposférico en banda P

China Huayun Meteorological Technology Group Co., Ltd.

Recomendaciones

Francia amplía su infraestructura de IA con NVIDIA, incluido un centro de datos de 44 megavatios

Nextivity lanza un sistema DAS 5G empresarial mejorado

El programa WOW! de EE. UU. expandirá la red de fibra óptica a 20,000 hogares en el otoño de 2026

O2 amplía su servicio de almacenamiento en la nube para usuarios en España con 10 TB gratuitos

Rohde & Schwarz lanza un receptor de monitorización portátil de 8 kHz a 8 GHz

El Foro de Lujiazui de China se centra en la remodelación de la industria financiera y la gobernanza de riesgos por parte de la IA

El proyecto europeo BEGONIA publica un documento de vista previa sobre la plataforma digital operativa

Google y un artista crean en Los Ángeles el primer museo de arte con IA del mundo

El Instituto de Investigación Científica de la Red Eléctrica del Sur de China completa el desarrollo de gafas inteligentes industriales con IA

Avisa App de Brasil presenta su servicio de marketing por WhatsApp en Web Summit Rio

Últimos boletines

GridCars de Sudáfrica desplegará infraestructura de carga para camiones en tres ubicaciones

Bechtel obtiene un contrato de 4.690 millones de dólares para ampliar Sabine Pass LNG en EE. UU.

El proyecto solar fotovoltaico de 120 MW de AMEA Power en Sudáfrica es el primero en entrar en operación comercial

N.A.N. GreenMet y Silox construyen una planta de reciclaje de baterías de 40.000 toneladas en India

Varios países del norte de África aceleran su apuesta por las energías renovables: Túnez fija como objetivo que las renovables representen el 50% de su matriz energética para 2035

La BDEW alemana propone 12 recomendaciones para la expansión de la red eléctrica

Honda de Japón y QuantumScape de EE. UU. colaboran en el desarrollo de baterías de estado sólido

La empresa conjunta sudafricana ZET recluta contratistas EPC para el proyecto de terminal de GNL

La capacidad fotovoltaica total instalada en Mercamadrid alcanza los 660 kWp

RWE pone en operación tres parques eólicos en Francia con una capacidad total de 68,8 MW