Cross-SecN=422中品質

複雑な眼科症例におけるGPT-4の医学的推論能力の評価

Assessing the medical reasoning skills of GPT-4 in complex ophthalmology cases

Milad D, et al. — British Journal of Ophthalmology, 2024

422症例でGPT-4診断精度48%。専門医と同等だが上級レジデントには劣る

対象集団422のOphthalmology Clinical ChallengesサンプルサイズN=422

エビデンスの限界

眼科一領域に限定されており、他の診療科への一般化は困難。Ophthalmology Clinical Challengesは一般外来症例より難易度が高い「挑戦的症例」であるため、日常的な眼科診療でのAI精度とは異なる可能性がある。またGPT-4の1バージョンのみの評価で、後続モデルでの再検証は未実施

読者の方へ

ニューイングランド医学誌の眼科版で出題される複雑な症例（Ophthalmology Clinical Challenges）422件で、GPT-4の医学的推論能力をテストした研究です。

エビデンス品質：中品質原文を読む →PubMed

この研究を解説した記事

未来の医療

複雑な眼科症例におけるGPT-4の医学的推論能力の評価

エビデンスの限界

読者の方へ

この研究を解説した記事

医療とAI——「ChatGPTに診てもらう」時代は本当に来るのか