Performance of ChatGPT, Bard, Claude, and Bing on the Peruvian National Licensing Medical Examination: a cross-sectional study.

Journal: Journal of educational evaluation for health professions
PMID:

Abstract

PURPOSE: We aimed to describe the performance and evaluate the educational value of justifications provided by artificial intelligence chatbots, including GPT-3.5, GPT-4, Bard, Claude, and Bing, on the Peruvian National Medical Licensing Examination (P-NLME).

Authors

  • Betzy Clariza Torres-Zegarra
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Wagner Rios-Garcia
    Sociedad Científica de Estudiantes de Medicina de Ica, Universidad Nacional San Luis Gonzaga, Ica, Peru.
  • Alvaro Micael Ñaña-Cordova
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Karen Fatima Arteaga-Cisneros
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Xiomara Cristina Benavente Chalco
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Marina Atena Bustamante Ordoñez
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Carlos Jesus Gutierrez Rios
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.
  • Carlos Alberto Ramos Godoy
    Universidad Nacional de Cajamarca, Cajamarca, Peru.
  • Kristell Luisa Teresa Panta Quezada
    Academic Department, USAMEDIC, Lima, Peru.
  • Jesus Daniel Gutierrez-Arratia
    Academic Department, USAMEDIC, Lima, Peru.
  • Javier Alejandro Flores-Cohaila
    Escuela de Medicina, Universidad Cientifica del Sur, Lima, Peru.