es.wedoany.com Noticia: Recientemente, un equipo de investigación de la Universidad Estatal de Pensilvania publicó un estudio sobre la fiabilidad de los modelos de lenguaje de gran tamaño en consultas médicas. La investigación muestra que los chatbots de inteligencia artificial tienen una precisión general de aproximadamente el 76,2 % al responder preguntas cotidianas relacionadas con la salud de usuarios comunes. Este resultado vuelve a poner en el punto de mira los límites de fiabilidad de la IA en escenarios como la consulta médica, la atención al cliente y las preguntas y respuestas de alto riesgo.
Este estudio se centró en preguntas de salud que los usuarios comunes de Internet podrían plantear, en lugar de limitarse a probar bancos de preguntas de exámenes médicos o casos clínicos predefinidos por expertos. El equipo de investigación organizó en la Universidad Estatal de Pensilvania una competencia de preguntas y respuestas de IA llamada "Diagnose-a-thon". 34 participantes presentaron 212 conjuntos de indicaciones y respuestas generadas por IA sobre dudas de salud reales o hipotéticas, utilizando modelos como ChatGPT-4o, ChatGPT-3.5, Gemini-1.5 Pro y Llama3-8b. Posteriormente, 9 médicos certificados evaluaron la precisión y el daño potencial de estas respuestas. Los resultados indicaron que aproximadamente el 76,2 % de las respuestas generadas por IA proporcionaban información precisa, pero la tasa de error seguía superando el 20 %. En un campo como la medicina, donde el margen de error es bajo, esta proporción es suficiente para afectar la percepción de los usuarios sobre la fiabilidad del sistema.
El estudio también encontró diferencias significativas en el rendimiento según la especialidad médica. Las respuestas de IA en áreas como obstetricia y ginecología, y otorrinolaringología mostraron una mayor efectividad y una puntuación de daño potencial más baja; mientras que en especialidades como medicina interna, neurología y dermatología, el rendimiento fue más débil, con una efectividad de respuesta menor y un riesgo potencial más alto. La calidad de las indicaciones también influyó en los resultados; las preguntas más específicas y aquellas con entre 60 y 250 caracteres tendieron a generar respuestas más precisas.
Estos resultados tienen implicaciones directas tanto para los sistemas de IA médica como para los de atención al cliente. Si un robot de consultas de salud se dirige directamente a los pacientes, los usuarios tienden a interpretar las respuestas como consejos de diagnóstico o base para la acción, mientras que el modelo puede carecer de la capacidad de realizar exámenes físicos, indagar en el historial médico, analizar datos de laboratorio e imágenes, y estratificar el riesgo clínico. Para hospitales, aseguradoras, plataformas de farmacia y empresas de salud digital, la IA es más adecuada para tareas como la organización preliminar de información, la síntesis de materiales previos a la consulta, la explicación de preguntas frecuentes y la asistencia a los médicos en la búsqueda de información. Luego, un médico capacitado debe realizar el juicio, la confirmación y la comunicación. Especialmente en áreas como neurología y dermatología, que dependen en gran medida de la experiencia profesional y la observación clínica, las respuestas de la IA deben integrarse en el flujo de trabajo del médico, en lugar de servir como base final para el autodiagnóstico del paciente.
El equipo de la Universidad Estatal de Pensilvania cree que la IA no reemplazará simplemente a los médicos humanos, pero tiene el potencial de mejorar la capacidad de los médicos para procesar información, explicar conocimientos médicos y atender a los pacientes. El estudio está programado para ser presentado en la Conferencia ACM sobre Equidad, Responsabilidad y Transparencia de 2026, que se celebrará del 25 al 28 de junio en Montreal, Canadá. A medida que los chatbots continúan integrándose en los sistemas de atención médica, finanzas, administración pública y atención al cliente empresarial, la precisión, las advertencias de riesgo, los mecanismos de intervención de profesionales y los límites de responsabilidad se convertirán en condiciones clave para la implementación a gran escala de la IA en la atención al cliente.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









