エビデンスライブラリ
SR/MAN=83高品質
生成AIと医師の診断精度比較:系統的レビューとメタアナリシス
A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians
Guo Y, et al. — npj Digit Med, 2025
83研究のメタアナリシスで生成AIの診断精度を医師と比較。全体精度52.1%で医師全体と有意差なし、ただし専門医にはAIが劣る。
対象集団生成AI(GPT-4等)の診断精度を検証した83研究サンプルサイズN=83
エビデンスの限界
各研究の対象疾患・プロンプト設計・評価基準が異質。画像入力の有無にもばらつき。臨床現場での前向き評価はほぼ含まれない。
読者の方へ
この研究は、ChatGPTなどの生成AIが医師とどのくらい正確に診断できるかを、83件の研究をまとめて分析したものです。
