Equipo de investigación de la University of California desarrolla nuevo método para controlar con precisión modelos de lenguaje grandes
2025-10-16 11:04
Fuente:University of California
Favoritos

El profesor Mikhail Belkin del Halıcıoğlu Data Science Institute (HDSI) del School of Computing, Information and Data Science (SCIDS) de la University of California San Diego, junto con su equipo, está dedicado a desarrollar perillas de control más finas para aplicaciones de inteligencia artificial (IA). Han descubierto exitosamente un método para controlar y modificar con mayor precisión modelos de lenguaje grandes (LLM), como los potentes sistemas de IA detrás de herramientas como Google Gemini y OpenAI ChatGPT. Este avance promete una IA más segura, confiable y adaptable.

El equipo de investigación incluye expertos de la Jacobs School of Engineering de la University of California San Diego, el Broad Institute del MIT y la Harvard University, entre otras instituciones. El profesor Belkin señaló que los modelos de lenguaje grandes actuales destacan en generar texto, traducir idiomas y responder preguntas, pero su comportamiento a veces es impredecible e incluso puede producir contenido dañino. Para enfrentar este desafío, el equipo desarrolló un método novedoso de “aprendizaje de características no lineales” que identifica y manipula características subyacentes importantes en las complejas redes de LLM.

Con esta técnica, los investigadores pueden entender en profundidad los procesos de pensamiento internos de las aplicaciones de IA, predecir e influir activamente en las salidas del modelo para producir respuestas más beneficiosas y menos dañinas. Su método incluye analizar las activaciones internas de LLM en diferentes capas, localizar con precisión características relacionadas con conceptos específicos, como toxicidad o precisión factual, y ajustarlas en consecuencia.

El equipo demostró la efectividad de su método en una serie de tareas, incluyendo detectar y mitigar la generación de información falsa por IA, y la harmfulidad y toxicidad. Además, esta tecnología puede guiar a los LLM para entender mejor conceptos en varios idiomas, mejorando la eficiencia y rentabilidad. El profesor Belkin declaró que, al enfocarse en características internas clave, pueden ajustar estos modelos potentes con menos datos y recursos computacionales, haciendo que las tecnologías de IA avanzadas sean más accesibles.

Esta clase de investigación abre puertas para desarrollar aplicaciones de IA más dirigidas, como asistentes de IA que proporcionan información médica precisa o herramientas de escritura creativa que evitan estereotipos dañinos. El equipo ha hecho público el código, alentando una mayor exploración y desarrollo en los campos de seguridad y control de IA.

Este boletín es una compilación y reproducción de información de Internet global y socios estratégicos, y está destinado únicamente a proporcionar a los lectores la comunicación. Si hay infracción u otros problemas, por favor infórmenos a tiempo, este sitio será modificado o eliminado. Toda reproducción de este artículo sin autorización formal está estrictamente prohibida. Correo electrónico: news@wedoany.com