「体外受精をしています。移植する胚をどうやって選ぶのか、先生に聞いても『見た目で判断します』としか言われなくて——」
不妊治療中の方からこういう声を聞くことがあります。実は「どの胚を子宮に戻すか」という判断は、生殖医療で最も難しい意思決定のひとつです。形がきれいな胚が必ずしも妊娠に至るわけではなく、逆に見た目が完璧でない胚から元気な赤ちゃんが生まれることもある。
先週、npj Digital Medicine誌に興味深い論文が掲載されました。AIが胚のタイムラプス画像から染色体異常のリスクを非侵襲的に予測し、その予測が着床成績と因果的に関連することを、4,674例の多施設データで示したのです。
論文の概要
タイトル原題: "Trial emulation for validating the clinical efficacy of a foundational AI model in embryo selection"
日本語訳: 胚選択における基盤AIモデルの臨床的有効性を検証するための試験エミュレーション
掲載誌: npj Digital Medicine(2026年4月23日)
著者: Rajendran S, Malmsten JE, Arnal LB, et al.
所属: Weill Cornell Medicine / IVIRMA Global Research Alliance
デザイン: 多施設ターゲット試験エミュレーション(後ろ向き因果推論)
対象: 4,674胚
何がわかったのか——「見た目」を超えたAIの目
この研究で評価されたのは「FEMI」というAIモデルです。原著では"foundational AI model"と呼ばれていますが、GPTのような汎用大規模モデルとは異なり、胚の画像評価に特化して設計されたモデルです。FEMIはタイムラプスインキュベーター(培養器に内蔵されたカメラで胚の発育を連続撮影する装置)の画像を解析し、胚の染色体倍数性(正常か異常か)のリスクスコアを算出します。

従来、胚の染色体異常を調べるには「PGT-A(着床前遺伝学的検査)」という方法が使われます。これは胚盤胞から数個の細胞を採取(生検)して遺伝子を解析する検査で、精度は高いものの、胚に物理的な損傷を与えるリスクがあり、コストも時間もかかります。FEMIはこの「生検」を必要とせず、カメラ映像だけで染色体異常のリスクを推定できる点が画期的です。
研究チームは「ターゲット試験エミュレーション」という因果推論の手法を用いました。これは観察データからランダム化比較試験に近い因果関係を推定する方法です。傾向スコアマッチングで交絡因子(母体年齢、クリニック差など)を調整した結果、以下が示されました。

開発コホートでは、FEMI-Ploidyの高リスクと判定された胚は、着床不成功リスクが平均13.1ポイント高い結果でした(ATE = -0.131、95%信頼区間 [-0.196, -0.066])。つまり、FEMIが「この胚は染色体異常のリスクが高い」と判定した場合、実際に着床しにくかったのです。
さらに外部検証コホートでも同様の傾向が確認されました(ATE = -0.157、95%信頼区間 [-0.254, -0.054])。効果はむしろ大きく、再現性が担保されています。
S-Learnerモデルを用いた比較解析では、FEMIの高リスクスコアは他のスコアリング手法(従来の形態学的評価など)と比較して、着床に対する影響が有意に強いことが示されました(p < 0.0001)。この優位性は母体年齢で調整した後も維持されており、FEMIが年齢とは独立した生物学的特徴を捉えていることを示唆しています。
なぜ重要なのか——タイムラプスだけでは不十分だった
ここで重要な文脈があります。
タイムラプス技術自体は以前からIVFで使われていますが、Jiangらが2023年に発表したシステマティックレビュー(14のRCT)では、タイムラプスによる胚選択は従来の形態学的評価と比較して、出生率・妊娠率・流産率のいずれも改善しなかったと報告されています [2]。唯一、着床率のわずかな改善(RR 1.10、95%CI [1.01, 1.18])が認められた程度でした。
つまり、タイムラプスの「カメラ」だけでは十分ではなく、その画像から何を読み取るかが鍵なのです。FEMIはまさにこの「読み取り」の部分をAIで革新しようとしています。
一方、非侵襲的な染色体評価の別のアプローチとして、培養液中の遊離DNAを解析するniPGT-Aや、代謝イメージング(蛍光寿命イメージング顕微鏡法など)も研究されています [3]。FEMIの強みは、既存のタイムラプスインキュベーターの画像をそのまま使えるため、追加の設備投資や検体処理が不要な点にあります。
注意点・限界——まだ「臨床導入」ではない
この研究にはいくつかの重要な限界があります。
まず、これは後ろ向き観察研究であり、前向きRCTではありません。ターゲット試験エミュレーションは因果推論の有力な手法ですが、未測定の交絡因子は排除できません。著者ら自身もこの研究を「前向きRCTへのpre-clinical justification(事前正当化)」と位置づけており、臨床的な推奨にはまだ至っていません。
また、FEMIはあくまで「染色体異常のリスク予測」であり、PGT-Aのように確定診断を下すものではありません。「低リスク」と判定されても染色体異常がある可能性はあり、その逆もあり得ます。
利益相反についても触れておく必要があります。著者の一部はAI企業のアドバイザリーボードメンバーであり、講演料を受領しています。研究の科学的質は高いものの、この点は読者として認識しておくべきです。
日本の読者にとって——世界一のIVF大国だからこそ

日本は体外受精の治療周期数が年間約50万件と世界最多水準で、体外受精で生まれる赤ちゃんは年間約7万人、出生児のおよそ9人に1人にのぼります(日本産科婦人科学会ARTデータブック)。2022年からは保険適用も始まり、不妊治療へのアクセスは大きく改善しました。
一方、日本ではPGT-Aは2020年に日本産科婦人科学会による臨床研究として承認され、現在は認定施設で実施されていますが、保険適用外で、費用は1周期あたり数十万円に及びます。
FEMIのような非侵襲的AI評価が実用化されれば、PGT-Aの生検によるリスクやコストの問題を回避しつつ、胚選択の精度を向上させる可能性があります。ただし、現時点ではまだ研究段階であり、日本での臨床導入の見通しは立っていません。
不妊治療中の方へ:
- 胚の選択方法について疑問があれば、担当医に「どのような基準で胚を選んでいるか」を尋ねてみてください
- PGT-Aに関心がある場合は、日本産科婦人科学会の認定施設で相談できます
- AIによる胚評価はまだ研究段階であり、現在の治療方針は十分にエビデンスに基づいたものです
医師の見解
正直に言うと、この論文で最も感銘を受けたのは「因果推論フレームワーク」の部分です。AIの医療応用では「精度が高い」だけでは不十分で、「その予測が臨床アウトカムに因果的に影響するか」を示す必要がある。この研究はその厳密な検証を行った点で、AI医療の評価方法そのものに一石を投じています。
不妊治療は身体的にも精神的にも大きな負担を伴います。「胚を傷つけずに、しかも精度よく選べる」技術は、患者さんにとって朗報です。ただし、実用化にはまだ前向き試験が必要であり、今はその手前にいます。焦らず、でも確実に、科学は前に進んでいます。
このテーマについて質問があれば、このメールに返信してください。