La compleja superficie de circunvoluciones y surcos de la corteza cerebral, que antes requería costosos equipos de cómputo a gran escala para su reconstrucción en tiempo real, ahora puede ser procesada por un chip del tamaño de un pulgar. 
El equipo del profesor Yang Yuchao, investigador de la Fundación Nuevos Pilares y profesor de la Facultad de Ingeniería de Circuitos Integrados de la Universidad de Pekín, en colaboración con el equipo del investigador Song Zhitang del Instituto de Microsistemas y Tecnología de la Información de Shanghái de la Academia China de Ciencias, ha desarrollado con éxito el primer chip de sistema neurodinámico del mundo basado en memristores de cambio de fase, reduciendo por primera vez la latencia de un solo paso de estas operaciones complejas a 2,12 milisegundos. En tareas como la reconstrucción de la corteza cerebral, este chip acelera el procesamiento entre 50 y 478 veces en comparación con las unidades de procesamiento gráfico (GPU) actuales más avanzadas, superando de un solo golpe el cuello de botella del cómputo en tiempo real que ha limitado la neurodinámica durante medio siglo. Los resultados se publicaron en la revista Science en la madrugada del día 3.
Yang Yuchao explicó a los periodistas que, para que las máquinas puedan modelar y comprender el mundo físico en tiempo real como el cerebro, se necesita un "sistema neurodinámico" que combine redes neuronales con ecuaciones diferenciales. Este sistema puede reconstruir estructuras cerebrales tridimensionales suaves y precisas a partir de datos incompletos y ruidosos, con un enorme potencial de aplicación.
Sin embargo, la arquitectura informática tradicional presenta un cuello de botella fundamental: la separación entre almacenamiento y cómputo. Durante el proceso de resolución, una gran cantidad de variables intermedias viajan constantemente entre la memoria y el procesador, como una enorme fábrica de datos donde se pierde mucho tiempo en el transporte, lo que no solo provoca una gran latencia, sino que también mantiene un alto consumo de energía.
Ante este desafío, el equipo de investigación encontró la solución en las propiedades físicas de los propios memristores. Aprovecharon el fenómeno único de "deriva de conductancia" de las memorias de cambio de fase: dentro de una cierta ventana de tiempo, su cambio de conductancia es predecible y puede controlarse con precisión.
Basándose en esto, el equipo propuso un nuevo paradigma de "cómputo controlado en memoria", que codifica directamente la búsqueda adaptativa del paso, la parte más lenta en la resolución de sistemas dinámicos, como un proceso de evolución física de la conductancia del dispositivo, completando el cálculo in situ dentro de la unidad de almacenamiento. En términos sencillos, las operaciones que antes requerían la ejecución repetida de circuitos digitales complejos, el acceso a la caché y el movimiento de datos, ahora se delegan a las leyes físicas del propio dispositivo para que "corran".
Lo que es aún más notable es que el equipo también mapeó los pesos de la red neuronal en los estados de conductancia multinivel de las memorias de cambio de fase, completando simultáneamente las operaciones de multiplicación y suma de matrices dentro de la misma matriz. Así, las dos tareas computacionales principales se integraron de manera unificada en una matriz de almacenamiento y cómputo con un área total de solo 0,28 milímetros cuadrados. Este chip, fabricado con un proceso de 40 nanómetros, funciona a una frecuencia de 50 megahercios, requiere solo 9 etapas de pipeline para una integración de un solo paso, logrando finalmente una latencia de iteración única de 2,12 milisegundos, llevando por primera vez el hardware neurodinámico a la era de los milisegundos.
"El rendimiento es realmente emocionante". Yang Yuchao indicó que, bajo la misma carga de trabajo, este chip es de 3,82 a 36,27 veces más rápido que los aceleradores especializados más avanzados actuales, y reduce el consumo de energía entre 11,75 y 24,73 veces. En la tarea de reconstrucción de alta fidelidad de la superficie de la corteza cerebral, incluso es hasta 478,18 veces más rápido que la GPU NVIDIA A100. La malla de la corteza cerebral reconstruida es suave y topológicamente consistente, capaz de representar con precisión las complejas estructuras de pliegues y suprimir eficazmente los artefactos y defectos de auto-intersección de los métodos tradicionales.
Yang Yuchao afirmó que este avance abre un nuevo espacio de posibilidades para las interfaces cerebro-computadora y el diagnóstico y tratamiento de enfermedades cerebrales. En el futuro, será posible crear gemelos digitales cerebrales individualizados y dinámicos, y la neuronavegación intraoperatoria, la detección temprana de la enfermedad de Alzheimer y las intervenciones personalizadas dispondrán de una base de hardware capaz de funcionar en tiempo real.
¿Qué es el "cómputo controlado en memoria"?
Si comparamos una computadora tradicional con una oficina, el procesador sería el "empleado de cálculo" sentado en el centro, y la memoria, los "archivadores" que cubren las paredes. Cada vez que se necesita un cálculo, el empleado tiene que levantarse para buscar los datos, calcular y luego volver a guardarlos; todo el tiempo se pierde en el trayecto. Este es el famoso "cuello de botella de von Neumann": la separación entre almacenamiento y cómputo, donde el movimiento de datos reduce la eficiencia.
La idea del "cómputo en memoria" es directa: hacer que el propio archivador aprenda a hacer cuentas. Los datos ya no necesitan ser trasladados, sino que el cálculo se realiza in situ dentro de la unidad de almacenamiento. Suena perfecto, pero su implementación está llena de dificultades: las unidades de almacenamiento están diseñadas solo para "recordar", y lograr que también "calculen", y que lo hagan con precisión y estabilidad, ya es un desafío.
El mayor problema radica en el "control". El cálculo no es una simple suma o resta; muchas tareas requieren ajustes dinámicos y decisiones en tiempo real. Cómo dotar a un conjunto de dispositivos físicos de la capacidad de "adaptarse sobre la marcha" es el umbral clave para que el cómputo en memoria se convierta en una realidad.
El punto de inflexión provino de una idea "contraintuitiva": aprovechar la característica de que la conductancia de los dispositivos se desvía de manera regular, algo que antes se consideraba un "defecto". Si se comprende su trayectoria de cambio, esta deriva puede ser domesticada y convertida en capacidad de cálculo: ya no se necesitan circuitos digitales para leer, escribir y comparar repetidamente, sino que el propio proceso físico realiza la operación.
Esta es la idea central del "cómputo controlado en memoria": permitir que la unidad de almacenamiento, mientras "recuerda", también "calcule" de la manera establecida por el diseñador y dentro de un rango controlable. El almacenamiento es el cómputo, y todo el proceso es preciso y controlable. El chip desarrollado bajo este paradigma puede comprimir operaciones complejas al nivel de milisegundos, mejorando la eficiencia energética decenas o incluso cientos de veces.
