- 著者: Kevin G Lee, Madeline Hopkins, Rachel Couban, Thecla Kattakkayam, Peter M Reardon, George Tomlinson, Tyler Pitre, Bram Rochwerg, Christopher J Yarnell
- Corresponding author: Christopher J Yarnell (Intensive Care Unit, Scarborough General Hospital, Toronto, ON, Canada)
- 雑誌: Lancet Respiratory Medicine
- 発行年: 2026
- Epub日: 2026-04-22
- Article種別: Systematic review and network meta-analysis
- PMID: 42034114
背景
AHRF (acute hypoxaemic respiratory failure、急性低酸素血症性呼吸不全) は ICU (intensive care unit、集中治療室) 入室患者の約10-15%を占め、侵襲的機械的換気を受ける患者の25%に相当する重篤な病態である (Villar et al. 2022)。AHRF に対しては、high-flow nasal cannula (HFNC)、continuous positive airway pressure (CPAP)、bilevel non-invasive positive pressure ventilation (NIPPV) などの非侵襲的呼吸支援が広く使用されており、気管挿管を回避できる可能性がある。一方、気管挿管は peri-intubation shock・心停止・気道外傷・せん妄・ICU 関連衰弱・人工呼吸器関連肺損傷 (ventilator-induced lung injury) といった深刻なリスクを伴う (Russotto et al. 2021; Vanhorebeek et al. 2020)。このため、可能な限り挿管を回避することが AHRF 管理の重要な目標となっている。
AHRF に対する非侵襲的呼吸支援の有効性については、複数の RCT (randomised controlled trial、ランダム化比較試験) および系統的レビューが蓄積されてきた。Ferreyro et al. (2020) による JAMA 掲載のメタ解析ではヘルメット型 NIPPV が全死亡率を低減する可能性が示された。Pitre et al. (2023) による NMA (network meta-analysis、ネットワークメタ解析) では、HFNC・ヘルメット型 CPAP・bilevel NIPPV が SOT (standard oxygen therapy、標準酸素療法) と比較して挿管率を低減することが示唆された (Pitre et al. Chest 2023)。しかし、これらの先行研究はいずれも、試験デザインにおける挿管基準 (criteria for intubation) の有無が治療効果の推定値に与える影響を体系的に評価しておらず、この点が知識のギャップ (gap in knowledge) として認識されていた。
現行の RCT では、挿管基準はエキスパート意見に基づき試験ごとに独自に設定されており、その内容は大きく異なる (Hakim et al. 2020)。挿管基準のある試験では実臨床への外挿性に疑問が生じ、一方で基準を持たない試験では非盲検化デザインによる臨床医の判断バイアスリスクが高まるという相反する懸念がある。FLORALI (high-flow oxygen versus standard oxygen multicentre RCT, Frat et al. 2015; Frat et al. NEnglJMed 2015) や HENIVOT (Helmet Noninvasive Ventilation vs Oxygen Therapy trial, Grieco et al. 2021; Grieco et al. JAMA 2021) などの主要試験が採用してきた挿管基準が実臨床の挿管決定とどの程度一致しているかも不明であった。挿管基準の有無が治療効果の外挿性に影響するかどうかは、これまでの NMA では手薄な領域として残されており、不足している知見として指摘されてきた (Yarnell et al. 2023)。
目的
本研究の目的は3点である。第一に、AHRF 患者に対する SOT・HFNC・CPAP・bilevel NIPPV の相対的治療効果を、2022 年以降の新規 RCT を含めて最新化すること。第二に、AHRF を対象とした RCT で使用された挿管基準の有病率と内容を体系的にカタログ化すること。第三に、試験における明示的な挿管基準の有無が、挿管率および死亡率への相対的治療効果を修飾するかどうかをネットワークメタ回帰分析を用いて評価することである。
結果
含まれた試験の基本特性: 2022 年以降の更新検索で 6261 件の新規引用が同定され、フルテキストレビューを経て 11 件の新規 RCT が追加された。先行レビューの 33 試験と合わせ、合計 n=44 の RCT が解析対象となった (Figure 1)。これら 44 試験には合計 n=9704 例の患者が登録されており、出版年は 1995 年から 2025 年にわたる。患者年齢の中央値は 59 歳 (IQR 53-63)、女性割合の中央値は 37% (IQR 29-45)、男性は 63% (IQR 55-71) であった。動脈血酸素分圧/吸入酸素濃度比 (P/F 比; ratio of arterial oxygen partial pressure to fractional inspired oxygen) の中央値は 149 mmHg (IQR 114-191) であった。15 試験が COVID-19 肺炎患者を含み、うち 12 試験は COVID-19 肺炎患者のみを対象としていた。また 12 試験が免疫抑制患者に焦点を当てていた。介入の内訳は、CPAP 11 試験、HFNC 26 試験、bilevel NIPPV 25 試験、SOT 28 試験であった。施設背景は ICU が大多数を占めたが、一般病棟・ステップダウン病棟・救急外来での実施も一部含まれた。非盲検化の性質上、全 44 試験において挿管・死亡アウトカムについてバイアスリスクが認められた (Table 1)。leave-one-out 解析では、個々の試験が統合推定値を大きく左右するものは認められなかった。ICU 管理下での実施が 37/44 試験 (84%) を占め、非 ICU 施設 (一般病棟・救急外来) での実施は 7 試験であった。
挿管基準の有病率と詳細な分類: 44 試験中 37 試験 (84%) に明示的な挿管基準が記載されていた。挿管基準のある試験における 1 試験あたりの基準数の中央値は 9 (IQR 6-11) であり、試験の多くは基準リスト中のいずれか 1 つを満たせば挿管を推奨する形式を採用していた。挿管基準は系統的に以下の 4 大カテゴリに分類された: (1) 生理学的基準——血行動態 (haemodynamic)、神経学的 (neurological)、呼吸 (respiratory; 酸素化・換気・呼吸困難/呼吸仕事量・気道開通性・呼吸停止に細分)、(2) デバイス固有基準 (device-specific; 特定インターフェースや設定に関連)、(3) 経時変化基準 (trajectory; 生理学的基準の時間的変化)、(4) 放射線学的基準 (radiological; 胸部 X 線所見)。最も多くの試験が採用したテーマは酸素化 (36/37 試験、97%)、次いで神経学的状態 (34 試験、92%)、換気 (33 試験、89%) であった (Figure 2)。
37 試験中 21 試験 (57%) が呼吸困難または呼吸仕事量 (dyspnoea / work of breathing) に関する基準を含んでいた。10 試験では単一基準ではなく複数基準の同時充足を要求する段階的アプローチが採用されており、例えば FLORALI 試験では呼吸基準の充足に呼吸数 >40 回/分・呼吸疲労徴候の不改善・気管分泌物増加・pH <7.35 のアシドーシス・SpO2 <90% の 5 分以上持続・NIPPV 不耐のうち少なくとも 2 項目を要求していた。4 試験では挿管基準がステップワイズ・エスカレーション (SOT/HFNC → CPAP/bilevel NIPPV → 挿管) のトリガーとして機能していた。12 試験が自施設で設定した挿管基準の根拠として過去の試験や臨床予測ルールへの引用を提示していたが、大多数の試験ではエキスパート意見に基づく基準が採用されていた。挿管基準の詳細なテーマ組み合わせは Figure 2 の UpSet プロットに可視化されている。
挿管に対する非侵襲的呼吸支援の効果: 挿管アウトカムに関するネットワークメタ解析には、37 試験からの 42 比較・n=8790 例が含まれた。SOT を参照群とした場合、CPAP は OR 0.45 (95% CrI 0.27-0.72、中程度の確信度)、HFNC は OR 0.61 (95% CrI 0.42-0.86、中程度の確信度)、bilevel NIPPV は OR 0.60 (95% CrI 0.39-0.89、中程度の確信度) であり、3 モダリティすべてが挿管率を有意に低減することが示された (Figure 3、Table 2)。CPAP が最も強い挿管抑制効果を示したが、各モダリティ間の直接比較では CPAP vs HFNC が OR 0.75 (95% CrI 0.44-1.22、低い確信度)、bilevel NIPPV vs HFNC が OR 0.98 (95% CrI 0.66-1.45、低い確信度)、bilevel NIPPV vs CPAP が OR 1.32 (95% CrI 0.74-2.40、非常に低い確信度) と、モダリティ間の優劣はエビデンスが不十分で明確に判断できなかった。挿管に関する不整合は bilevel NIPPV vs HFNC (node-splitting p = 0.03) および HFNC vs SOT (p = 0.02) の比較で認められた。確信度の格下げ理由は主に不整合性 (inconsistency) と非一貫性 (incoherence) であった。なお、CPAP が全モダリティ中で最も強い挿管抑制効果を示したことは、持続的気道陽圧による肺胞リクルートメントおよび呼吸仕事量軽減効果を示唆する。
死亡率に対する非侵襲的呼吸支援の効果: 死亡率に関するネットワークメタ解析には、34 試験からの 39 比較・n=8789 例が含まれた。SOT と比較して、CPAP は OR 0.73 (95% CrI 0.55-0.95、低い確信度)、HFNC は OR 0.83 (95% CrI 0.66-0.98、低い確信度) と死亡率を低減する可能性が示唆された (Table 2)。一方、bilevel NIPPV は OR 0.93 (95% CrI 0.71-1.17、低い確信度) であり、死亡率の有意な低減は認められなかった。CPAP における死亡率の確信度は重大な不精確性 (imprecision) と非一貫性 (incoherence) から「低い」に格下げされた。HFNC においても不整合性と非一貫性が確認された。出版バイアスは比較調整ファネルプロットで認められなかった。CPAP vs HFNC の死亡率は OR 0.87 (95% CrI 0.65-1.21、中程度の確信度)、bilevel NIPPV vs HFNC は OR 1.11 (95% CrI 0.91-1.38、低い確信度) であった。
挿管基準の有無による治療効果の修飾: ネットワークメタ回帰分析の主要解析において、挿管基準の有無は相対的治療効果を修飾しなかった。例えば CPAP vs SOT の挿管 OR は、挿管基準あり群で 0.41 (95% CrI 0.23-0.69)、挿管基準なし群で 0.56 (95% CrI 0.28-1.08) であり、両群とも SOT に対する CPAP の優位性という方向性が一致していた。共変量をより柔軟に (exchangeable または unrelated) モデル化した感度解析においても DIC の改善は認められず、挿管基準を共変量として追加してもデータの記述が改善しないことが確認された (Figure 3)。呼吸困難または呼吸仕事量基準の有無を共変量とした追加メタ回帰でも、SOT に対する各モダリティの効果は基準有無で同等であり、呼吸仕事量基準が治療効果を修飾するというエビデンスは得られなかった。
Post-hoc 感度解析:インターフェース・COVID-19・免疫抑制患者における効果: NIPPV をフェイスマスクとヘルメットインターフェースで細分した代替ネットワーク解析では、SOT との比較において HFNC の挿管 OR は 0.60 (95% CrI 0.43-0.83)、フェイスマスク NIPPV は 0.58 (95% CrI 0.41-0.79)、ヘルメット NIPPV は 0.19 (95% CrI 0.09-0.37) であり、ヘルメット NIPPV が最も顕著な挿管抑制効果を示した。死亡率でも HFNC OR 0.80 (95% CrI 0.64-0.96)、フェイスマスク NIPPV OR 0.83 (95% CrI 0.68-0.99)、ヘルメット NIPPV OR 0.50 (95% CrI 0.31-0.79) と、すべてのモダリティが SOT を上回った。この代替ネットワークにおいても、挿管基準有無による治療効果の修飾は認められなかった。COVID-19 以外の AHRF 患者を対象とした試験では bilevel NIPPV・CPAP・HFNC のいずれも SOT より挿管率を低減したが、COVID-19 肺炎患者のみを対象とした試験では各モダリティの効果が SOT と同程度まで減弱し、病因による異質性が示唆された。免疫抑制患者のみを対象とした試験と混合コホートとの比較では、挿管・死亡率の結果に大きな差は認められなかった。
考察/結論
本研究は 44 RCT・9704 例を対象に、AHRF 患者に対する非侵襲的呼吸支援の有効性を更新評価するとともに、臨床試験における挿管基準の特性と、その使用が治療効果に与える影響を初めて系統的に評価したネットワークメタ解析である。主要な結論として、CPAP・HFNC・bilevel NIPPV はいずれも SOT と比較して挿管率を低減する可能性が高く (中程度の確信度)、CPAP と HFNC は死亡率も低減する可能性が示唆された (低い確信度)。とりわけ重要な知見は、試験における挿管基準の有無がこれらの治療効果を修飾しないという点である。
これまでの研究では、Pitre et al. (2023) らの NMA が HFNC・ヘルメット CPAP・bilevel NIPPV の有効性を示していたが、挿管基準の使用という試験デザイン変数が効果推定値に影響を与えるかどうかは評価されてこなかった。本研究はこの点を新規に定量評価し、明示的な挿管基準が設けられた試験 (84%) と設けられなかった試験において相対的治療効果が一致することを示した。これは既報の RCT 結果が実臨床の多様な状況に対しても外挿可能であるという重要な根拠を提供する。またヘルメット型 NIPPV の挿管抑制効果 (OR 0.19) は他のモダリティと対照的に際立っており、インターフェース選択が治療効果に影響し得ることを示唆する。
本研究で初めて示されたのは、試験デザイン上の挿管基準の有無という変数が、AHRF に対する非侵襲的呼吸支援の相対的有効性を左右しないという点である。これは新規の知見であり、臨床的意義が高い。臨床現場では明示的な挿管基準が設けられないまま日常診療が行われることも多く、そのような環境においても試験結果が適用可能であるという確信を臨床医に与える。さらに、本解析が AHRF の病因 (COVID-19 肺炎 vs 非 COVID-19 肺炎) による異質性を明確に示した点も重要であり、COVID-19 肺炎においては非侵襲的呼吸支援の効果が SOT との差として顕在化しない可能性がある。
残された課題として、まず挿管基準なしの試験が n=7 と少なく、メタ回帰における検出力に制約がある。すべての試験が非盲検化によるバイアスリスクを有しており、この点は今後の研究でも回避困難な構造的問題として残る。また多くの試験が挿管基準の充足と実際の挿管実施との乖離やそのタイムラグを記録しておらず、基準がアウトカムに与える影響を直接推定できなかった。今後の研究として、将来の RCT が挿管基準充足率と実際の挿管実施率を同時に記録・報告することが提言される。また、挿管基準そのものを介入として比較するランダム化試験 (早期 vs 待機的挿管基準) や、COVID-19 以外の特定病因サブグループに焦点を当てた解析も今後の検討が求められる。
方法
本研究は PRISMA NMA 拡張ガイドラインに従った系統的レビューおよびベイジアンネットワークメタ解析 (Bayesian network meta-analysis) であり、研究プロトコルは Open Science Framework (OSF; https://osf.io/f8qeh) に 2024-01-23 に事前登録された。文献検索は MEDLINE、Embase、Cochrane CENTRAL、CINAHL (Cumulative Index to Nursing and Allied Health Literature)、Web of Science、PubMed データベースにおいて、データベース開設から 2025-11-18 まで実施した。これは Pitre et al. (2023) による 2022 年以前の検索を更新したものである。
対象試験は、18歳以上の成人 AHRF 患者を対象に HFNC (流速 ≥30 L/min)、NIPPV (CPAP または bilevel 方式)、または SOT を比較した RCT とした。既に侵襲的換気を受けている患者、侵襲的換気を介入とする試験、うっ血性心不全または COPD (chronic obstructive pulmonary disease) が主要原因の患者が 50% 超の試験、抜管直後・術後直後の患者を主とする試験は除外した。2 名の著者 (KGL・MH) が独立してスクリーニングとデータ抽出を実施し、不一致は第三者 (CJY) が解決した。
バイアスリスク評価には RoB 2 (Risk of Bias 2) ツールを使用し、エビデンスの確信度は GRADE (Grading of Recommendations, Assessment, Development and Evaluations) アプローチで評価した。治療ノードは SOT・HFNC・bilevel NIPPV・CPAP の 4 種に定義した。ベイジアン NMA は R 4.4.2 の gemtc パッケージで実施し、Markov chain Monte Carlo (MCMC) アルゴリズムにより 5000回のウォームアップと 20000回のサンプリングを行い、random-effects model を採用した。挿管基準の有無 (有 vs 無) を研究レベル共変量としたネットワークメタ回帰分析を主解析とし、共変量を exchangeable (ランダム効果) または unrelated (固定効果) としてモデル化する感度解析を追加した。モデル適合度は DIC (deviance information criterion、逸脱情報量基準) で比較した。出版バイアスは比較調整ファネルプロットで、直接・間接推定値の非一貫性は node-splitting 法で評価した。事後的な感度解析として、NIPPV をフェイスマスクとヘルメットインターフェースで細分した代替ネットワーク解析、COVID-19 肺炎患者限定の試験に関するメタ回帰、免疫抑制患者のみを対象とした試験に関するメタ回帰を実施した。