Investigadores del Departamento de Ingeniería Nuclear y Ciencias Radiológicas (NERS) de la Universidad de Michigan, en colaboración con el Laboratorio Nacional de Idaho, llevaron a cabo un estudio sobre microreactores nucleares y aprendizaje automático (ML). El resumen correspondiente ha sido publicado, y el artículo completo, titulado "Control de transitorios y seguimiento de carga en microreactores nucleares basado en aprendizaje por refuerzo profundo", aparece en el número de julio de la revista Energy Conversion and Management: X.

Basado en el diseño del microreactor Holos-Quad de HolosGen, el estudio investigó un nuevo enfoque de aprendizaje automático —el aprendizaje por refuerzo (RL) multiagente— para modelar el ajuste de la salida de potencia de un microreactor nuclear con el fin de satisfacer la demanda de la red eléctrica. Los investigadores afirman que este método es más eficiente en el entrenamiento y requiere menos tiempo que los enfoques anteriores, lo que puede ayudar a modelar los reactores más rápidamente.
El Holos-Quad es un microreactor de alta temperatura refrigerado por gas, diseñado específicamente para la generación de energía escalable y autónoma. Su arquitectura se inspira en los motores a reacción de ciclo cerrado, reemplazando la cámara de combustión tradicional con cápsulas selladas de combustible nuclear. Integra el combustible, el moderador, el intercambio de calor y la conversión de energía en un solo recipiente a presión, con un diseño compacto que permite su instalación en un contenedor estándar de la Organización Internacional de Normalización (ISO) de 40 pies.
El equipo de investigación se centró en simular el seguimiento de carga, es decir, aumentar o disminuir la producción de energía según la demanda de la red eléctrica. El sistema Holos-Quad controla la potencia ajustando la posición de ocho tambores de control que rodean el núcleo del reactor. Un lado de estos tambores está revestido con material absorbente de neutrones: girarlos hacia adentro absorbe neutrones y reduce la potencia, mientras que girarlos hacia afuera la aumenta. En el enfoque RL multiagente, los ocho tambores de control se modelan como ocho agentes independientes, donde cada tambor específico se controla de forma independiente pero tiene acceso a la información de todo el núcleo.
Al comparar y probar el método del modelo RL multiagente con el método de agente único (un solo agente controla los ocho tambores) y el método estándar de la industria de control proporcional-integral-derivativo (PID) (que tiene bucles de control basados en retroalimentación), los resultados mostraron ventajas para el modelo RL.
Los investigadores señalan que su modelo de aprendizaje automático necesita una validación extensa en condiciones más complejas y realistas antes de poder aplicarse comercialmente en la industria de la energía nuclear. Sin embargo, los resultados del estudio "abren un camino más eficaz para el aprendizaje por refuerzo en microreactores nucleares autónomos".
