ChatGPTやGPT-4に米国脳外科専門医模擬試験を受けさせたら合格レベルを軽くクリア:ただしGCSスコア計算は苦手かも

公開日:

2023年9月28日  

最終更新日:

2023年11月28日

【背景】

医療界でも大規模言語モデル(LLM)に対する関心が急速に高まっている.LLMの代表であるOpenAI社のChatGPTは2022年初頭にトレーニングしたGPT-3.5シリーズをチャット向けにチューニングしたものである.一方,GPT-4は2023年に公開された最新バージョンで,大幅な機能向上が図られている.本稿は,米国で脳外科専門医試験の受験生(日本の脳外科専攻医に相当)が受験勉強に用いているSANS(自己評価脳外科試験)問題集の筆記第1試験500題を用いて,この2つのLLMの能力を評価したものである.試験は多肢選択・単一解答方式である.対照には過去の脳外科専攻医の同一試験問題の解答実績を用いた.