本文へスキップ
医学よろず相談
エビデンスライブラリ
SR/MAN=83高品質

生成AIと医師の診断精度比較:系統的レビューとメタアナリシス

A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians

Guo Y, et al.npj Digit Med, 2025

83研究のメタアナリシスで生成AIの診断精度を医師と比較。全体精度52.1%で医師全体と有意差なし、ただし専門医にはAIが劣る。

対象集団生成AI(GPT-4等)の診断精度を検証した83研究サンプルサイズN=83

エビデンスの限界

各研究の対象疾患・プロンプト設計・評価基準が異質。画像入力の有無にもばらつき。臨床現場での前向き評価はほぼ含まれない。

読者の方へ

この研究は、ChatGPTなどの生成AIが医師とどのくらい正確に診断できるかを、83件の研究をまとめて分析したものです。

エビデンス品質:高品質原文を読む →PubMed

この研究を解説した記事

免責事項:本サイトの情報は医療行為(診断・処方・治療)を提供するものではありません。健康上の判断は必ず医師にご相談ください。