SR/MAN=83高品質

生成AIと医師の診断精度比較：系統的レビューとメタアナリシス

A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians

Guo Y, et al. — npj Digit Med, 2025

83研究のメタアナリシスで生成AIの診断精度を医師と比較。全体精度52.1%で医師全体と有意差なし、ただし専門医にはAIが劣る。

対象集団生成AI（GPT-4等）の診断精度を検証した83研究サンプルサイズN=83

各研究の対象疾患・プロンプト設計・評価基準が異質。画像入力の有無にもばらつき。臨床現場での前向き評価はほぼ含まれない。

この研究は、ChatGPTなどの生成AIが医師とどのくらい正確に診断できるかを、83件の研究をまとめて分析したものです。

エビデンス品質：高品質原文を読む →PubMed

この研究を解説した記事