公開日:
2023年9月28日最終更新日:
2023年11月28日【背景】
医療界でも大規模言語モデル(LLM)に対する関心が急速に高まっている.LLMの代表であるOpenAI社のChatGPTは2022年初頭にトレーニングしたGPT-3.5シリーズをチャット向けにチューニングしたものである.一方,GPT-4は2023年に公開された最新バージョンで,大幅な機能向上が図られている.本稿は,米国で脳外科専門医試験の受験生(日本の脳外科専攻医に相当)が受験勉強に用いているSANS(自己評価脳外科試験)問題集の筆記第1試験500題を用いて,この2つのLLMの能力を評価したものである.試験は多肢選択・単一解答方式である.対照には過去の脳外科専攻医の同一試験問題の解答実績を用いた.
ここから先は閲覧有料です。