Hoy en día, herramientas de inteligencia artificial como los modelos de lenguaje grandes (LLM) de OpenAI, ChatGPT y Google Gemini, pueden ofrecer consejos sobre relaciones, redactar textos e incluso escribir artículos científicos. Sin embargo, ¿pueden resolver acertijos de sudoku y dar explicaciones razonables? Un equipo de científicos informáticos de la Universidad de Colorado en Boulder investigó esta cuestión. El equipo diseñó cerca de 2300 acertijos de sudoku originales y utilizó múltiples herramientas de IA para intentar resolverlos.

Los resultados de la investigación muestran que el rendimiento de la IA al resolver sudokus es desigual. Aunque algunos modelos pueden resolver acertijos simples, incluso los mejores modelos tienen dificultades para explicar claramente el proceso de resolución, y sus descripciones suelen ser confusas, inexactas o incluso extrañas. La coautora del estudio, María Pacheco, señaló que estos resultados plantean dudas sobre la credibilidad de la información generada por la IA. "Para ciertos tipos de acertijos de sudoku, la mayoría de los modelos de IA aún carecen de la capacidad de proporcionar explicaciones comprensibles para los humanos", dijo Pacheco. Ella y sus colegas publicaron estos hallazgos en Findings of the Association for Computational Linguistics.
El estudio no tenía como objetivo hacer trampa, sino explorar la forma de pensar de la IA a través de ejercicios lógicos. El coautor, el profesor Fabio Somenzi, cree que estos resultados podrían conducir a programas informáticos más confiables y dignos de confianza. "Los acertijos son divertidos, pero también son una miniatura para estudiar el proceso de toma de decisiones del aprendizaje automático", dijo. Actualmente, la mayoría de los modelos de IA tienen dificultades para formar un pensamiento lógico similar al humano, lo que se debe en gran parte a su método de entrenamiento. Por ejemplo, ChatGPT responde preguntas prediciendo la siguiente palabra, casi como una versión informática del aprendizaje memorístico. Investigadores como Pacheco y Somenzi están trabajando para fusionar la capacidad de memoria de la IA con la capacidad lógica del cerebro humano, una búsqueda conocida como inteligencia artificial "neuro-simbólica". En las pruebas, la versión preliminar del modelo o1 de OpenAI resolvió correctamente alrededor del 65% de los acertijos de sudoku, pero a menudo inventaba hechos o se desviaba por completo del tema al explicar el proceso de resolución. Los investigadores esperan diseñar sistemas de IA que puedan resolver acertijos complejos y explicar claramente el proceso de resolución; actualmente están comenzando su investigación con acertijos similares al sudoku, como los "hitori".











