エビデンスライブラリ
Cross-SecN=422中品質
複雑な眼科症例におけるGPT-4の医学的推論能力の評価
Assessing the medical reasoning skills of GPT-4 in complex ophthalmology cases
Milad D, et al. — British Journal of Ophthalmology, 2024
422症例でGPT-4診断精度48%。専門医と同等だが上級レジデントには劣る
対象集団422のOphthalmology Clinical ChallengesサンプルサイズN=422
エビデンスの限界
眼科一領域に限定されており、他の診療科への一般化は困難。Ophthalmology Clinical Challengesは一般外来症例より難易度が高い「挑戦的症例」であるため、日常的な眼科診療でのAI精度とは異なる可能性がある。またGPT-4の1バージョンのみの評価で、後続モデルでの再検証は未実施
読者の方へ
ニューイングランド医学誌の眼科版で出題される複雑な症例(Ophthalmology Clinical Challenges)422件で、GPT-4の医学的推論能力をテストした研究です。
