El investigador Alessandro Ingrosso del Donders Institute for Brain, Cognition and Behaviour colaboró con colegas de dos instituciones de investigación italianas para desarrollar un nuevo método matemático para predecir la efectividad del aprendizaje por transferencia en redes neuronales. Los resultados de la investigación se publicaron en la revista "Physical Review Letters".

En el campo de la inteligencia artificial, el entrenamiento de sistemas a menudo depende de grandes cantidades de datos. Sin embargo, en ciertos escenarios de aplicación, como el diagnóstico de cáncer mediante ultrasonido en el campo médico, las redes neuronales son difíciles de entrenar correctamente debido a la falta de suficientes muestras de entrenamiento. Ingrosso explicó: "Esto lleva a un fenómeno de 'sobreajuste', donde la capacidad de generalización de la red en nuevos casos se limita, resultando en un gran número de falsos positivos y falsos negativos".
Para abordar este desafío, los investigadores se centraron en la tecnología de "aprendizaje por transferencia", que busca transferir el conocimiento de redes entrenadas en grandes conjuntos de datos a nuevas redes basadas en datos limitados. Ingrosso dijo: "Investigamos el modelo más simple de aprendizaje por transferencia y construimos una teoría matemática para redes de una sola capa oculta".
En el proceso de construcción teórica, los investigadores combinaron innovadoramente dos métodos de análisis: el método de "renormalización nuclear" desarrollado recientemente y la forma clásica "Franz-Parisi" de la teoría de vidrios de espín. Esta combinación permite a los investigadores manejar directamente conjuntos de datos reales, en lugar de depender de modelos estadísticos o aproximaciones. Ingrosso agregó: "Nuestro nuevo método puede predecir directamente y con precisión la efectividad de la generalización de datos en la red objetivo cuando se aplica el conocimiento de la red fuente".
Esta investigación proporciona nuevas ideas para entrenar efectivamente sistemas de inteligencia artificial en áreas con escasez de datos, como diagnóstico médico y otras aplicaciones especializadas.











京公网安备 11010802043282号