• 著者: Gaurav Singal, Peter G. Miller, Vineeta Agarwala, et al.
  • Corresponding author: Gaurav Singal (Foundation Medicine, Inc, Cambridge, MA)
  • 雑誌: JAMA
  • 発行年: 2019
  • Epub日: 2019-04-09
  • Article種別: Original Article
  • PMID: 30964529

背景

精密医療の進展に伴い、個々の腫瘍ゲノム情報と臨床アウトカムを統合した大規模なクリニカルゲノムデータベースの構築が喫緊の課題となっている。従来のクリニカルゲノム研究は、主に臨床試験、単施設シリーズ、または全国登録データベースに依存してきた。例えば、Zehir et al. NatMed 2017AACR Project GENIE Consortium. Cancer Discov 2017 のような多施設ゲノムデータベースは貴重な情報を提供するものの、治療内容や詳細な臨床アウトカムの記録が不十分な場合が多いことが指摘されている。これらのデータソースは、学術医療機関に偏る傾向があり、米国でがん患者の約85%が治療を受けるコミュニティ診療環境を十分に代表していないという根本的な問題があった。このような背景から、日常診療から得られるリアルワールドデータ (RWD) を活用した研究の重要性が増しており、2016年の21st Century Cures Actでもその必要性が認識され、臨床研究の補完が推奨された。

Flatiron Healthの電子カルテ (EHR) データベースは、275以上の施設から200万人以上のがん患者のデータを含む大規模なものであり、Foundation Medicineの包括的ゲノムプロファイリング (CGP) 結果は、FoundationOneプラットフォームを用いて395遺伝子の完全エクソンカバレッジと500〜1,000倍の深度で高品質なゲノムデータを提供する。これら二つの大規模データベースを連結することで、詳細な臨床アウトカム情報と高品質なゲノムデータを同時に有する、他に類を見ない大規模なリアルワールドエビデンス (RWE) データソースが構築可能となる。このアプローチの実現可能性は、2016年にAgarwala et al.によって初めて報告されたが、非小細胞肺癌 (NSCLC) に特化した詳細な解析、および新たな仮説生成への有用性を大規模コホートで実証した報告はこれまで不足していた。特に、免疫療法応答に関するバイオマーカーの探索や、希少な分子サブタイプにおける治療効果の評価において、従来の臨床試験では得られにくい情報が求められており、大規模なリアルワールドデータを用いた解析が未開拓の領域であった。例えば、Carbone et al. NEnglJMed 2017 のような大規模臨床試験では、特定のバイオマーカーのサブグループ解析に限界があり、実臨床での多様な患者背景や治療パターンを網羅することは困難であった。本研究は、このギャップを埋めることを目的としている。

目的

本研究の目的は、Flatiron HealthのEHR由来臨床データとFoundation Medicineの包括的ゲノムプロファイリング (CGP) 結果を連結して構築されたクリニカルゲノムデータベースが、非小細胞肺癌 (NSCLC) 患者における以下の点を評価し、リアルワールドデータ活用によるクリニカルゲノム手法の実現可能性と有用性を確認することである。(1) NSCLCの既知のゲノム・臨床特性および治療アウトカムとの関連性を再現できるか。(2) 特に免疫療法応答に関する新たな仮説生成に有用であるかを評価すること。具体的には、ドライバー遺伝子変異と標的療法の奏効、腫瘍変異負荷 (TMB) と免疫療法の奏効との関連性を検証し、実臨床データに基づく大規模なクリニカルゲノムデータベースの妥当性と臨床的有用性を確立することを目指した。本研究は、リアルワールドデータを用いた探索的解析を通じて、既知の臨床的関連性を再現し、新たな知見を導き出すことで、精密医療の進展に貢献することを目指す。

結果

コホートの概要と既知のゲノム特性の再現性: 本研究のクリニカルゲノムデータベースには、4,064例の非小細胞肺癌 (NSCLC) 患者が含まれた。患者の臨床的特徴は、中央値年齢66.0歳 (IQR 58.0-73.0)、女性51.9%、喫煙歴あり79.3%、非扁平上皮癌77.6%であった。進行病態の患者は3,522例 (86.7%) であった。ゲノム変異の分布は、The Cancer Genome Atlas (TCGA)のNSCLC解析結果と概ね一致しており、TP53が最も頻繁に変異する遺伝子であり、腺癌ではEGFR変異が高頻度、扁平上皮癌ではCDKN2A変異が高頻度であることが確認された (Figure 1, Figure 2)。これにより、本データベースがNSCLCの実際のゲノム景観を代表していることが示された。主要なドライバー変異の頻度は、EGFR変異が17.2% (701例)、ALK転座が3.1% (128例)、ROS1転座が1.0% (42例) であった。7年間の追跡期間中に1,946例が死亡し、コホート全体の5年生存率は3.8%であった。

ドライバー変異と臨床的特徴の関連性: ドライバー変異と臨床的特徴の関連性も既報の疫学的特性と一致していた。例えば、EGFR変異を有する患者は、アジア系 (8.4% vs 2.0%, p<0.001)、女性 (62.8% vs 49.6%, p<0.001)、非喫煙者 (46.9% vs 14.8%, p<0.001) に有意に多かった。ALK転座を有する患者は、若年 (中央値58歳 vs 67歳, p<0.001) および非喫煙者 (57.0% vs 19.2%, p<0.001) に有意に多かった。また、MET変異を有する患者は高齢者 (中央値71歳 vs 66歳, p<0.001) に多かった (eTable 2)。これらの結果は、本データベースの妥当性を裏付けるものである。

ドライバー変異陽性患者における標的療法の効果: NCCN (National Comprehensive Cancer Network) リストのドライバー変異 (EGFR, ALK, ROS1, MET, BRAF, RET, ERBB2) を有する進行病態の患者1,135例のうち、NCCN推奨標的療法を受けた575例は、受けなかった560例と比較して、進行診断からの全生存期間 (OS) が有意に延長した (中央値18.6ヶ月 vs 11.4ヶ月, HR 0.65, 95% CI 0.50-0.85, p<0.001) (Figure 3B)。特にEGFR変異陽性患者に限定すると、EGFR阻害薬治療群 (n=380) は非治療群 (n=186) と比較して、中央OSが21.0ヶ月 vs 13.3ヶ月 (HR 0.62, 95% CI 0.47-0.81, p<0.001) と有意に改善した (Figure 3C)。さらに、EGFR阻害薬による治療期間は、EGFR変異陽性患者 (中央値10.3ヶ月) でEGFR野生型患者 (中央値2.8ヶ月) よりも有意に長かった (HR 0.35, 95% CI 0.28-0.44, p<0.001)。臨床的ベネフィット率 (CBR) もEGFR変異陽性患者で有意に高かった (86.1% vs 50.9%, p<0.001)。

ドライバー変異と腫瘍変異負荷 (TMB) の関係: ドライバー変異とTMBの関係を解析した結果、EGFR変異 (中央値3.5 vs 7.8 mut/Mb, p<0.001)、ALK転座 (2.1 vs 7.0 mut/Mb, p<0.001)、ROS1転座 (4.0 vs 7.0 mut/Mb, p=0.03)、RET変異 (4.6 vs 7.0 mut/Mb, p=0.004) は、いずれも野生型と比較して有意に低いTMBと関連していた。特にROS1転座の42例における中央TMBは4.0 mut/Mb (IQR 1.2-9.6) であり、ROS1野生型4,022例の中央値7.0 mut/Mb (IQR 2.6-13.0) を有意に下回った (p=0.03)。これは、ROS1陽性NSCLCが免疫療法から恩恵を受けにくい免疫学的背景を有することを示唆する。一方、PIK3CA変異 (中央値8.7 vs 7.0 mut/Mb, p=0.002) およびKRAS変異 (中央値8.4 vs 6.1 mut/Mb, p<0.001) はTMB高値と関連していた。喫煙歴はTMBと強く関連し、喫煙歴ありの患者では中央値8.7 mut/Mb、非喫煙者では2.6 mut/Mbであり (p<0.001)、喫煙関連DNA損傷がTMB上昇の主要因であることを支持した (eFigure 3A)。

免疫療法成績とTMBの予測価値: 抗PD-1/PD-L1療法を受けた患者1,290例 (31.7%) において、TMB高値 (TMB-H; ≥20 mut/Mb, n=161〜162) 群は、TMB低値/中値 (TMB-L/I; <20 mut/Mb, n=1,116〜1,127) 群と比較して、治療開始からの全生存期間 (OS) が有意に長かった (中央値16.8ヶ月 vs 8.5ヶ月, HR 0.50, 95% CI 0.38-0.66, p<0.001) (Figure 4B)。また、治療期間もTMB-H群で有意に長かった (中央値7.8ヶ月 vs 3.3ヶ月, HR 0.42, 95% CI 0.32-0.55, p<0.001)。臨床的ベネフィット率 (CBR) もTMB-H群で有意に高かった (80.7% vs 56.7%, p<0.001)。多変量Cox比例ハザード回帰分析では、TMB連続値は治療継続期間の独立予測因子であり、10 mut/Mb増加するごとにハザード比 (HR) 0.78 (95% CI 0.65-0.95, p=0.01) で治療中止リスクが低下することが示された (eTable 4)。

TMBとPD-L1発現の独立性: PD-L1テスト結果が利用可能な1,235例のうち、抗PD-1/PD-L1療法を受けた482例を解析した。PD-L1陽性群 (n=289) とPD-L1陰性群 (n=662) のTMB中央値は、いずれも6.95 mut/Mb (IQR 3.5-14.0) と同等であり、TMBとPD-L1発現は相関しない独立したバイオマーカーであることが確認された (Figure 4A)。これはCarbone et alの報告とも一致する。しかし、PD-L1陰性患者においては、TMB-HとTMB-L/I間での治療期間 (p=0.06) およびOS (p=0.10) に有意差は認められず、PD-L1陰性集団におけるTMBの予測的価値は限定的である可能性が示唆された。

考察/結論

データベースの妥当性と新規性: 本研究は、Flatiron HealthのEHRデータとFoundation Medicineの包括的ゲノムプロファイリング (CGP) 結果を連結したクリニカルゲノムデータベースが、非小細胞肺癌 (NSCLC) における既知のゲノム・臨床関連性、すなわちドライバー変異の疫学的特性、標的療法との奏効関連、および腫瘍変異負荷 (TMB) と免疫療法奏効の関連性を再現できることを実証した。この結果は、フランス協力胸部インターグループ (IFCT) の全国分子プロファイリング研究 (Barlesi et al., Lancet 2016) と同様の遺伝子変異頻度を示しており、本データベースがリアルワールドのNSCLC患者層を代表していることを強く支持する。本研究で初めて、大規模なリアルワールドデータを用いて、ドライバー遺伝子変異と標的療法、TMBと免疫療法の関連が再現可能であることを示した点は新規性が高い。特に、EGFR阻害薬がEGFR変異陽性患者のOSを延長するという知見は、クロスオーバーデザインの臨床試験では確認が困難であったため、リアルワールドデータによる検証は臨床的意義が大きい。

ROS1転座と免疫療法の臨床的含意: ROS1転座を有するNSCLC患者において、TMBが有意に低い (中央値4.0 mut/Mb) という知見は、ROS1陽性NSCLC患者における免疫療法の奏効割合が低いという既報の臨床結果 (Mazieres et al., Ann Oncol 2019) と生物学的に整合する。この結果は、ROS1陽性NSCLCが免疫療法から恩恵を受けにくい免疫学的背景を有することを定量的に支持するものであり、今後の治療戦略を検討する上で重要な臨床的含意を持つ。同様に、EGFRやALK変異においても低TMBが確認されており、これらのドライバー変異陽性例における免疫療法の限定的な有効性を説明する重要な知見である。

リアルワールドエビデンスの限界と残された課題: 本研究にはいくつかの重要な限界が存在する。第一に、無作為化されていない観察研究であるため、標的療法を受けた患者と受けなかった患者の間には、既知および未知の交絡因子が存在する可能性がある。例えば、良好なパフォーマンスステータスや医療アクセス、患者選好を持つ患者が標的療法を受ける傾向があるため、観察された生存延長に治療者の意思決定バイアスが寄与している可能性は残された課題である。第二に、最大治療奏効 (MTR) の評価はRECIST基準ではなく、担当医のEHR記録に基づくため、研究間の再現性に限界がある。第三に、CGP検査を受けた患者には選択バイアスが存在する可能性があり、より積極的な治療を受ける傾向のある患者層が過剰に代表されている可能性がある。第四に、死亡データの完全性も限界であり、全ての死亡が把握されているわけではない。これらの限界から、本解析は探索的・仮説生成的なものと位置付けられ、今後の前向き検証や確認研究が必要である。今後の検討課題として、このアプローチの前向き検証、より詳細な多変量解析、追加の免疫療法バイオマーカー (腫瘍内異質性、免疫スコアなど) との統合、および非EHR基盤の死亡データとの照合精度の向上が挙げられる。

方法

データソースと連結:本研究は、New England Institutional Review Boardの承認を得て実施され、参加者のインフォームドコンセントは免除された。患者データの非識別化は、HIPAA (Health Insurance Portability and Accountability Act) ガイドラインに準拠して行われた。Flatiron Healthの電子カルテ (EHR) データベースとFoundation Medicineのゲノムデータを連結したレトロスペクティブコホート研究である。Flatiron HealthのEHRデータベースは、米国の275のがん診療施設から得られた200万人以上のがん患者の縦断的臨床データを含み、その約85%はコミュニティ診療環境に由来する。Foundation Medicineのゲノムデータは、商業的な包括的ゲノムプロファイリング (CGP) 検査結果から構成される。データ連結は、HIPAA準拠の非識別化された「トークン」を用いて、第三者機関であるManagement Science Associatesが実施した。患者の個人情報にアクセスすることなく、確率的マッチングにより臨床データとゲノムデータを統合した。解析に用いられたデータは2011年1月1日から2018年1月1日までの期間のものである。本研究は、無作為化比較試験 (RCT) ではなく、リアルワールドデータを用いた観察研究として実施された。

NSCLCコホートの定義:まず、ICD-9 (International Classification of Diseases, Ninth Revision) / ICD-10コード (ICD-9: 162.x; ICD-10: C34.xまたはC39.9) に基づき肺癌患者をスクリーニングした。その後、医療記録の手動審査によりNSCLC診断を確定し、CGP検体がNSCLCまたは原発不明癌と病理医によって判定された症例を対象とした。CGP検体採取日がNSCLCの臨床診断日の1ヶ月前以降である患者が組み入れられた。最終的に、4,064例のNSCLC患者が解析コホートに含まれた。

患者特性:コホートの中央値年齢は66.0歳 (IQR 58〜73) で、女性が51.9%、喫煙歴ありが79.3%であった。組織型は非扁平上皮癌が77.6%、扁平上皮癌が17.9%を占めた。進行病態 (ステージIIIB/IVまたは再発・転移性) の患者は3,522例 (86.7%) であった。追跡期間中に1,946例の死亡が確認された。

ゲノムプロファイリング:腫瘍ゲノムプロファイリングは、Frampton et al. NatBiotechnol 2013 によって開発されたFoundationOneプラットフォームを用いて実施された。このプラットフォームは、395遺伝子の完全エクソンカバレッジとイントロン領域の再構成解析を、500〜1,000倍の深度で行う (全サンプルの87.7%が最新のT7 baitsetを使用)。点変異、増幅、欠失、重複、挿入、スプライス部位変異、再構成は、既知の病原性、可能性のある病原性、意義不明のバリアント、または生殖細胞系列の一塩基多型に分類された。NCCN (National Comprehensive Cancer Network) にリストされたドライバー変異は、EGFR、ALK、ROS1、MET、BRAF、RET、またはERBB2遺伝子における病原性または可能性のある病原性変異と定義された。

腫瘍変異負荷 (TMB):TMBは、シーケンスされたDNAのメガベースあたりの体細胞変異数として全患者で算出された。免疫療法への応答に関する先行研究 Goodman et al. MolCancerTher 2017 に基づいて、TMB高値 (TMB-H) は20変異/Mb以上、TMB低値/中値 (TMB-L/I) は20変異/Mb未満と定義された。

PD-L1発現:PD-L1発現レベルはEHRから抽出された。PD-L1陰性はEHRで「陰性」と報告された場合、または次世代シーケンスを実施する中央検査室での22C3 PD-L1抗体を用いた染色で50%未満の染色が認められた場合と定義された。PD-L1陽性はEHRで「陽性」と報告された場合、または22C3またはSP142 PD-L1抗体を用いた染色で50%以上の染色が認められた場合と定義された。PD-L1検査結果は、治療開始前または開始後30日以内に報告された場合に解析に含められた。

臨床アウトカム:主要評価項目は、全生存期間 (OS; 死亡または追跡不能までの期間)、治療期間 (特定の治療ラインにおける治療曝露期間)、最大治療奏効 (MTR; EHRに記載された担当医評価に基づく最良奏効)、および臨床的ベネフィット率 (CBR; 安定病変 (SD) + 部分奏効 (PR) + 完全奏効 (CR) の割合) であった。OSの死亡データは、EHR、抄録、商業死亡データ、社会保障死亡指数を含む4つのデータソースを統合した高精度複合エンドポイントから導出された。

統計解析:記述統計量には中央値と四分位範囲 (IQR)、割合と頻度が用いられた。群間比較にはログランク検定が使用された。治療曝露は時間依存性共変量として扱われ、不死時間バイアスを補正した。選択バイアスを考慮し、左打ち切りも調整された。多変量モデルでは、年齢、性別、人種/民族、喫煙歴、組織型、治療ライン、EGFR/ALK変異、TMB、PD-L1状態が調整された。多重検定補正にはBenjamini-Hochberg法が適用された。統計的有意水準はp<0.05とされた。解析はRソフトウェアバージョン3.5.1およびPythonソフトウェアバージョン3.6.5を用いて実施された。