原題
Next-Generation Multicenter Studies: Using Artificial Intelligence to Automatically Process Unstructured Health Records of Patients with Lung Cancer across Multiple Institutions.
背景:構造化されていない記録からのRWDの手動による抽象化は、時間がかかり、エラーが発生しやすく、一貫性がない。LLMは抽出を拡大する可能性があるが、多施設での検証が必要である。
方法:微調整されたLLMは、フランスの10のセンターにわたる肺癌患者のPDFから31の変数を抽出した。試験コホート311;一致および盲検判定によるグラウンドトゥルース。
結果:8,708のデータポイントで、LLMエラーは7.0%対手動14.2%(p<0.001)であった。F1は遺伝子変化、併存疾患および転移部位で改善し、部位間分散は低下した。30%の低信頼度出力のハイブリッドレビューは、エラーを4.4%に削減した。生存推定値はグラウンドトゥルースと一致した。
結論:AIはエラーを減らし、一貫性を高め、スケーラブルな多施設RWD抽出と試験的使用を可能にした。
Journal: Ann Oncol (CiteScore 2022: 63)
DOI: 10.1016/j.annonc.2025.12.006
PMID: 41407195

コメント