Liquid AI de EE. UU. lanza un modelo de borde de 8B, activando solo 1.5B por inferencia
2026-06-04 11:52
Favoritos

es.wedoany.com Noticia: La empresa de inteligencia artificial Liquid AI, surgida del Instituto Tecnológico de Massachusetts, lanzó recientemente un nuevo modelo, LFM2.5-8B-A1B, con un total de 8 mil millones de parámetros, pero que activa solo 1.5 mil millones de parámetros por inferencia, utilizando menos de una quinta parte de los parámetros totales en términos de potencia computacional real. Este modelo está diseñado específicamente para escenarios de borde como teléfonos móviles, PC, robots y servidores ligeros, sin participar en la competencia de modelos grandes en la nube.

En los últimos dos años, la industria ha adoptado métodos como cuantización, poda y destilación para ejecutar modelos grandes en dispositivos IoT, comprimiendo modelos diseñados originalmente para la nube y desplegándolos en dispositivos de borde. Liquid AI ha seguido una ruta técnica diferente, centrándose en cambiar la "forma de alimentación" del modelo, de modo que consuma menos recursos al procesar tareas simples y solo active más potencia computacional para tareas complejas. Específicamente, la energía consumida por cada inferencia del modelo está directamente vinculada a la dificultad de la tarea de entrada, logrado mediante el mecanismo de activación dispersa del modelo de expertos mixtos (MoE): el sistema solo activa los módulos expertos más relevantes para una tarea de entrada, manteniendo el resto en estado de reposo.

En el borde, la restricción central de la inteligencia pasa del costo computacional al costo energético. La energía consumida (en julios) por cada inferencia de un chip integrado es limitada y fija. Aunque métodos como cuantización, poda y destilación pueden reducir el tamaño del modelo, no cambian el patrón de que cada inferencia requiere recorrer todos los parámetros, lo que es difícil de sostener bajo estrictas restricciones de batería. La ruta técnica de Liquid AI consiste en hacer que la potencia computacional consumida varíe dinámicamente según la dificultad de la tarea de entrada, logrando un "cálculo adaptativo a la entrada". Esta idea proviene del estudio del nematodo Caenorhabditis elegans, que tiene solo 302 neuronas en todo su cuerpo, pero cuya inteligencia depende de cambios dinámicos en la fuerza de las conexiones sinápticas entre neuronas, no de la acumulación de escala.

El modelo LFM2.5, al tiempo que conserva operadores eficientes de bajo nivel, superpone el mecanismo de activación dispersa MoE, con un total de 8 mil millones de parámetros y activando solo alrededor de 1.5 mil millones por inferencia, que es la lógica subyacente. La ruta técnica de Liquid AI ha evolucionado desde redes dinámicas de tiempo continuo tempranas hasta la arquitectura de activación dispersa actual, compartiendo el núcleo de hacer que la cantidad de cálculo varíe con la entrada. Además, esta corriente técnica también se centra en la robustez del modelo después del despliegue. A diferencia de los modelos estáticos, las redes neuronales líquidas modelan mediante ecuaciones de tiempo continuo y constantes de tiempo adaptativas, permitiendo que su estado interno "fluya" y se ajuste en tiempo real según el ritmo de la señal de entrada. Múltiples demostraciones del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (MIT CSAIL) muestran que los agentes impulsados por este tipo de redes pueden navegar de manera robusta en entornos desconocidos, enfrentando cambios ambientales. En comparación con los métodos que dependen de actualizaciones remotas OTA para enviar nuevos modelos, esta arquitectura inherentemente robusta puede defenderse contra perturbaciones desconocidas aún no surgidas.

En la era de la inteligencia en el borde, el valor industrial se está desplazando de los extremos del modelo y el chip hacia la capa de colaboración entre ambos. El modelo LFM lanzado por Liquid AI está optimizado para la compatibilidad de hardware desde el diseño inicial de la arquitectura, y oficialmente se afirma que puede ejecutarse sin problemas en GPU, CPU o NPU, cubriendo dispositivos heterogéneos como wearables, robots, teléfonos móviles, PC y automóviles. La empresa colaboró con AMD en enero de este año, y en solo dos semanas completó la personalización y el despliegue local de un modelo de 2.6 mil millones de parámetros en el procesador Ryzen AI de este último. La capacidad central detrás de esta eficiencia es la habilidad de ingeniería para aproximarse rápidamente a la combinación óptima de operadores y la ocupación mínima de memoria bajo restricciones extremas de hardware.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com