• 著者: Peng Liang, Arthur B. Pardee
  • Corresponding author: Arthur B. Pardee (Dana-Farber Cancer Institute) および Peng Liang (Vanderbilt University Medical Center)
  • 雑誌: Nature Reviews Cancer
  • 発行年: 2003
  • Epub日: N/A
  • Article種別: Review
  • PMID: 14668817

背景

がんは多遺伝子性の疾患であり、癌遺伝子や癌抑制遺伝子は多くの場合、下流遺伝子群の発現を制御するシグナル分子として機能する (Sager 1997)。したがって、差次的遺伝子発現 (differential gene expression) の解析は、がんの分子回路を解明するための中心的戦略となってきた。1970年代後半の1次元蛋白質ゲル電気泳動によるp53の発見から始まり、recombinant DNA技術、PCR、DNAシークエンシングの連続的な技術革新とともに、mRNA発現解析技術は過去約20年で著しく進化した。

2003年時点ではDNAマイクロアレイが主流となり、がんの分類、診断、予後予測への応用が活発に進められていた (Golub et al. 1999)。しかし、事前の配列情報が必要な「クローズド系」の根本的制約 (新規遺伝子発見不可) と、複雑なcDNAプローブを使用した低発現mRNAへの感度・特異度の問題が残存していた。例えば、低発現遺伝子の検出は依然として困難であり、多くの研究で「ノイズ」の問題が指摘されていた (Kuo et al. 2002; Kothapalli et al. 2002)。一方、著者らが1992年に開発した差次的ディスプレイ (DD) や、1995年にKinzlerおよびVogelstein研究室が開発したSAGE (Serial Analysis of Gene Expression) は「オープン系」として新規遺伝子発見を可能にしたが、スループットや必要なバイオインフォマティクス支援の点で課題を持っていた。これらのオープン系手法は、既知の遺伝子配列に依存しないため、未知の遺伝子や転写産物の発見に貢献したが、その網羅性や定量性には限界があった。

先行研究では、がんの分子分類や予後予測に遺伝子発現プロファイリングが用いられてきたが (Alizadeh et al. 2000; Sorlie et al. 2001)、異なる研究間での結果の再現性や、データ解釈の難しさが課題として残されていた (Wooster 2000; Petricoin et al. 2002)。特に、マイクロアレイデータにおける「ノイズ」の問題は、多くの研究者によって指摘されており、統計的解析手法の改善が求められていた (Goryachev et al. 2001; Quackenbush 2002)。これらの技術的、解析的な課題が、がん研究における遺伝子発現解析の進展を妨げる要因となっていた。本レビューは、これらの技術の進化と課題を体系的に整理し、今後の方向性を示すことを目的としている。特に、マイクロアレイのような「クローズド系」技術が新規遺伝子発見において不足しているという知識ギャップが存在し、この点が未解明なままであった。

目的

本論文の目的は、mRNAおよび蛋白質レベルで差次的遺伝子発現を解析する技術の約20年にわたる進化を体系的に論じ、各技術の原理、強み、および限界を比較することである。特に「オープン系」(新規遺伝子発見可能) と「クローズド系」(既知配列のみ対応) という根本的な対比を軸に、腫瘍抑制因子p53の標的遺伝子の発見をケーススタディとして、各技術の実際的な活用例を示す。また、DNAマイクロアレイデータにおける「ノイズ」の問題や、機能的検証の重要性についても強調し、今後の遺伝子発現解析の方向性について考察する。最終的には、がん研究における遺伝子発現解析の現状と課題を明確にし、より信頼性の高いデータ取得と解釈のための指針を提供することを目指す。

結果

蛋白質ゲル電気泳動による先駆的発見: 1970年代後半、SV40 (Simian Virus 40) 感染細胞と正常細胞の1次元蛋白質ゲル比較によりp53が発見された (Linzer & Levine 1979)。実際にはSV40 T抗原との蛋白質相互作用によるp53の安定化が過剰蓄積をもたらしていた。O’Farrell (1975) が開発した2次元 (2D) 蛋白質ゲル電気泳動は、1,000以上の蛋白質を分子量×等電点で同時可視化することを可能にした。CroyとPardeeは、がん細胞と正常細胞の差異が2D電気泳動で検出可能なごく少数の蛋白質 (2,000種のうちのごく一部) に限られることを示し (Croy & Pardee 1983)、「微妙な発現変化ががんを規定する」という概念を確立した。しかし、低発現蛋白質の検出感度不足や蛋白質量不足が根本的限界として残り、推定10,000種以上の発現蛋白質のうち約2,000種しか検出できなかった。この技術は、初期のがん研究において重要な発見をもたらしたが、その後の分子生物学的特性評価には不十分であった。

差次的ハイブリダイゼーションとその限界: Recombinant DNA技術の登場後、mRNA由来の32P標識cDNAプローブをファージcDNAライブラリーに差次的にハイブリダイゼーションする手法が開発された (Sargent 1987)。この手法は、ホルモン応答乳癌遺伝子やHTLV (Human T-cell Leukemia/Lymphoma Virus) 関連遺伝子の発見に貢献したが (Masiakowski et al. 1982; Manzari et al. 1983)、複雑なcDNAプローブ (10,000種のmRNA由来) を用いた「reverse northern」アプローチでは、低発現遺伝子 (細胞あたり数コピー以下) の検出は事実上不可能であることが判明し、subtraction法への移行を促した (Sargent 1987)。Figure 1に示されるように、この方法は多数のプラークを比較する必要があり、網羅性と感度の両面で課題を抱えていた。

Subtractive hybridization (SH) とその貢献: ZimmermannらがAspergillus分化研究 (1980) で開発したSH法は、2種の細胞で共通発現するcDNAを除去することでプローブ複雑度を大幅に削減し、低発現mRNAの差次的検出を初めて実現した (Zimmermann et al. 1980)。Figure 2にその原理が示されている。Mark Davis研究室によるT細胞受容体の同定 (1980年代中頃) や (Hedrick et al. 1984)、Bert Vogelstein研究室によるp53標的WAF1 (CDK2阻害因子) の同定 (El-Deiry et al. 1993) がSHの代表的成果である。p21単独ではp53腫瘍抑制機能を媒介できないことが、p21ノックアウトマウス (n=数匹) が腫瘍形成傾向を示さなかった知見から明らかになり (Deng et al. 1995)、さらなるp53標的探索を促した。SHは、低発現遺伝子の発見において画期的な進歩をもたらした。

Differential Display (DD) — 著者らが1992年に開発: DDは逆転写PCRとポリアクリルアミドゲル電気泳動を組み合わせ、アンカー化オリゴdTプライマー3種類 (3’末端をC, G, Aで終える) と任意配列の短いプライマーセットにより真核生物mRNAの3’末端を系統的に増幅・表示するオープン系手法である (Liang & Pardee 1992)。Figure 3にその詳細なプロトコルが示されている。任意プライマーは1種類あたり50〜100 mRNAを認識するよう設計されており、プライマーペアの組み合わせで細胞全体のmRNA (推定n=10,000種) をカバーできる数学的モデルに基づく (Liang et al. 1995)。発現変化 (2倍以上のfold change) を示す遺伝子を差次的にバンドとして可視化し、RAS (McCarthy et al. 1995)、v-REL (You et al. 1997)、ERBB (Park et al. 1999) などの癌遺伝子標的遺伝子を同定した。RAS標的として同定された1種のサイトカインがIL-24 (インターロイキン24) である (Wang et al. 2002)。初期には「偽陽性」の問題があったが、技術的改善により大幅に減少した (Liang 1998)。

DDで同定されたp53標的遺伝子群: 多数のp53標的遺伝子がDDで同定された。Table 1に記載された主要なDD発見遺伝子は、Cyclin G (細胞周期制御) (Okamoto & Beach 1994)、EI24/PIG8 (アポトーシス、DDとSAGEの両方で同定) (Gu et al. 2000)、PAG608 (新規zinc-finger蛋白質、アポトーシス) (Israeli et al. 1997)、DDA3 (新規遺伝子、成長抑制) (Lo et al. 1999)、TP53TG1 (新規遺伝子、DNA損傷) (Takei et al. 1998)、TP53TG3 (新規遺伝子、細胞周期チェックポイント) (Ng et al. 1999)、p53R2 (ribonucleotide reductase) (Tanaka et al. 2000)、NOXA (新規遺伝子、プロアポトーシスBH3蛋白質) (Oda et al. 2000)、PIDD (新規遺伝子、death-domainを含む) (Lin et al. 2000)、p53AIP1 (p53リン酸化依存性アポトーシス) (Oda et al. 2000)、p53DINP1 (p53リン酸化依存性アポトーシス) (Okamura et al. 2001)、PIRH2 (ubiquitin ligase、p53の負の制御因子) (Leng et al. 2003) などである。DDはオープン系のため、これらの多くは既知配列情報なしに同定された新規遺伝子であった。

SAGE (Serial Analysis of Gene Expression) — 1995年開発: SAGEはKinzlerおよびVogelstein研究室が開発したデジタル定量法である (Velculescu et al. 1995)。各mRNAから3’末端に近い10〜14塩基のシグネチャータグを抽出してコンカタマー化・シークエンシングし、各タグの出現頻度でmRNA量を定量する。Figure 5にそのプロセスが示されている。DDと同じオープン系であるが、10〜14塩基タグの一意性保証にbioinformatic支援を要する。NIH Cancer Genome Anatomy Project (CGAP) のSAGE Genieデータベースが多様な正常・腫瘍細胞のSAGEデータを公開し、遺伝子発現パターンの検索を可能にした (Boon et al. 2002; Liang 2002)。SAGEで同定されたp53標的遺伝子としてTable 1に記載されているのは、14-3-3σ (成長抑制)、PIG3 (NADPH-quinone oxidoreductase)、KILLER/DR5 (アポトーシス、SHとの重複)、EI24/PIG8 (DDとの重複) などがある。

DNAマイクロアレイ (クローズド系の限界): BrownおよびBotstein (Stanford) のcDNAマイクロアレイ (Schena et al. 1995) とAffymetrix GeneChip (オリゴアレイ) (Chee et al. 1996) は数万遺伝子の同時発現解析を実現した。Figure 4にその原理が示されている。白血病 (Golub et al. 1999)、リンパ腫 (Alizadeh et al. 2000)、肺腺癌 (Garber et al. 2001; Bhattacharjee et al. 2001)、乳癌 (Sorlie et al. 2001)、前立腺癌 (Dhanasekaran et al. 2001) の分子分類と診断に活用された。しかしクローズド系のため事前の配列情報が必須で、新規遺伝子の発見はできない。Arnold Levine研究室は6,000遺伝子Affymetrix GeneChipでp53標的遺伝子を探索し、107遺伝子上昇・54遺伝子低下 (合計161遺伝子、全アレイの約2.7%) を同定した (Zhao et al. 2000)。別のcDNA microarray研究 (33,000以上の独自ヒトcDNA/EST、総スポット数約33,000) では1,500以上の潜在的p53標的が示唆された (Wang et al. 2001)。しかしTable 1に記載されたより確実に機能特性化されたp53標的の80%超はDDやSAGEなどオープン系で発見されており、マイクロアレイの新規遺伝子発見における限界を定量的に示した。

cDNAプローブの複雑性という根本問題: マイクロアレイでは10,000種に及ぶcDNAプローブの複雑性から、個別の低発現mRNAのシグナルが特異的かつ定量的かどうかの保証が困難である (Sargent 1987)。著者らは、遺伝子特異的プライマーで1種類のmRNAのみを標識したシングルプローブをアレイにハイブリダイゼーションする対照実験で、マイクロアレイの実際の感度・特異度を明らかにすることを提唱した (Box 1)。また、ESTs (expressed sequence tags) の大規模シークエンシングからCraig Venterが開発したMPSS (Massively Parallel Signature Sequencing) は、5マイクロメートルマイクロビーズ上での17〜20塩基シグネチャーシークエンシングでmRNA量を定量するオープン系新技術として紹介された (Brenner et al. 2000)。

技術比較の定量的整理 (Table 1の数値的側面): Table 1では27種の機能的に特性化されたp53標的遺伝子が同定方法とともに列挙された (n=27遺伝子)。カテゴリー別にみると、MDM2、WAF1、GADD45、BAX、FAS/APO1、PTEN、BID、APAF1は候補遺伝子アプローチ (生化学・分子生物学的仮説に基づく)、14-3-3σ、PIG3、PUMA、EI24はSAGEによる発見、Cyclin G、PAG608、DDA3、TP53TG1、TP53TG3、p53R2、NOXA、PIDD、p53AIP1、p53DINP1、PIRH2、p53DINP1はDDによる発見、KILLER/DR5、PERP、IGF BP3はSHによる発見として分類された。このリストでDD由来が約11種、SAGE由来が約5種、SH由来が約4種、候補が約8種 (複数手法での重複あり) と、オープン系 (DD+SAGE+SH合計) が機能特性化済みp53標的の80%超を発見したことが明示された。これはArnold Levine研究室の6,000遺伝子GeneChipで107遺伝子上昇・54遺伝子低下が同定された、あるいはより大規模な33,000以上のユニークヒトcDNA/ESTを搭載したマイクロアレイで1,500超の潜在的p53標的が示唆されたという数値と対比されており、マイクロアレイが大量の候補を提示する一方でその多くが確認・機能特性化未完のまま残っていることを示した。

2003年時点での技術的展望: 著者らは既存手法すべてが生物学的・技術的文脈の中でそれぞれ適切な役割を持つとし、「どの手法も免罪されない」(guilty by association ではなく機能的証拠が必要) という原則を強調した。p53が初発見から約25年経過してなお「単一の癌遺伝子」から「腫瘍抑制因子」への再評価を経て、現在は組織特異的な遺伝子ネットワークを制御するという概念が確立されつつあったことを事例として、遺伝子発現プロファイリングの発見から機能的理解への長い道のりを示した (Vogelstein et al. 2000)。新技術として予告されたRNA干渉 (RNAi) はこうした機能解析を加速させると期待された。

考察/結論

本論文は、差次的遺伝子発現解析技術の約20年の進化を6つのカテゴリー (蛋白質電気泳動、差次的ハイブリダイゼーション、SH、DD、SAGE、マイクロアレイ) に整理し、各技術の原理、強み、および限界を具体的事例とともに比較した。とくに「オープン系 (DD・SAGE・SH) vs クローズド系 (マイクロアレイ)」という軸と「感度・新規遺伝子発見可能性」のトレードオフを、p53標的遺伝子発見の実績 (機能特性化済み27標的の80%超がオープン系発見、Arnold Levine研究室GeneChip 107上昇・54低下 vs DD・SAGEで発見された多数の新規遺伝子) で定量的に示した点が独自の貢献である。

先行研究との違い: 2003年時点でマイクロアレイへの熱狂的移行を批判的に捉え、複雑なcDNAプローブが低発現mRNA検出に根本的な感度・特異度問題を持つという指摘は先見性があった。これまでの多くのレビューがマイクロアレイの可能性に焦点を当てる一方で、本論文はその限界と「ノイズ」の問題を明確に指摘し、異なる技術間の比較を通じて、その特性を浮き彫りにした点で対照的である。

新規性: 本研究で初めて、機能的に特性化されたp53標的遺伝子の大部分がDDやSAGEといったオープン系技術によって発見されたことを定量的に示した。これは、マイクロアレイが大量の候補遺伝子を提示する一方で、その多くが機能的検証を欠いているという、当時の知識ギャップを埋める新規な知見である。

臨床応用: 本論文が体系化した差次的発現解析の枠組みは、その後の乳癌21-gene recurrence score (Oncotype DX) や70-gene signature (MammaPrint)、肺癌および多がん種の免疫シグネチャー、びまん性大細胞型B細胞リンパ腫のGCB/ABC分類など、臨床実装された予後・治療選択シグネチャーの方法論的基盤に連なる。本知見は、がんの分子診断や個別化医療の発展に臨床的意義を持つ。

残された課題: その後のRNA-seqによる全トランスクリプトーム定量シークエンシングへの移行は、本論文が指摘した課題を大部分解決した。次世代シークエンシング (NGS) は、(1) オープン系で既知・未知転写産物を配列知識なしに検出、(2) デジタル定量でダイナミックレンジが複数桁広く低発現遺伝子でも高精度、(3) 選択的スプライシング・融合遺伝子・SNVを同時検出、という点でDDとSAGEの新規遺伝子発見力とマイクロアレイのスループット・網羅性を統合した到達点となった。一方、著者らが強調した「関連性は罪を証明しない」(guilty by association 禁止) という機能的バリデーションの必要性は、RNA-seq時代においても依然として中心的課題である。本論文が2003年に指摘したデータ解釈の難しさ (ノイズ・統計的検出力・生物学的文脈への翻訳) はRNA-seq、scRNA-seq、spatial transcriptomics時代にも本質的に継続する課題であり、特に腫瘍内不均一性 (ITH) の転写的評価では空間的・時間的文脈を明示したうえで発現差を解釈する必要性がますます認識されている。p53の事例に象徴されるように、発見から20〜25年かけて機能が解明される「時間的ギャップ」は、本論文の指摘した機能的バリデーションの困難さを端的に物語っている。今後の検討課題として、転写後制御 (RNA安定性・選択的スプライシング・翻訳効率) の差次的解析、エピゲノム・ゲノム・トランスクリプトームの統合マルチオミクス解析、spatial transcriptomicsによる空間的差次的発現の解明、およびscRNA-seqによる細胞種ごとの差次的発現の単細胞解像が挙げられる。

方法

本論文は、がん研究における差次的遺伝子発現解析技術の進化をレビューしたタイムライン記事であるため、特定の実験方法や患者コホートを用いた研究は実施されていない。代わりに、過去約20年間に開発された主要な遺伝子発現解析技術(蛋白質ゲル電気泳動、差次的ハイブリダイゼーション、サプレッションハイブリダイゼーション (SH)、差次的ディスプレイ (DD)、Serial Analysis of Gene Expression (SAGE)、DNAマイクロアレイなど)について、その原理、技術的特徴、利点、および限界を文献に基づいて体系的に分析した。文献検索は、PubMed および Web of Science を用いて、1970年代後半から2003年までの期間に公開された関連論文を対象に実施した。特定の inclusion/exclusion criteria は設けず、各技術の発展とがん研究への応用に関する主要な報告を網羅的にレビューした。

特に、各技術のがん研究への応用事例として、腫瘍抑制因子p53の標的遺伝子探索における貢献に焦点を当てた。p53標的遺伝子の発見事例を詳細に比較検討し、各技術が新規遺伝子の同定にどの程度貢献したか、またその後の機能的特性評価がどの程度進んだかを評価した。この評価には、Table 1に示された機能的に特性化されたp53標的遺伝子の同定方法の分類が含まれる。

また、DNAマイクロアレイのような「クローズド系」技術と、DDやSAGEのような「オープン系」技術の根本的な違いを強調し、それぞれの技術が持つ「新規遺伝子発見可能性」と「網羅性」のトレードオフについて議論した。マイクロアレイデータにおける「ノイズ」の問題については、複雑なcDNAプローブの使用が低発現mRNAの検出感度と特異度に与える影響を考察し、遺伝子特異的プライマーを用いたシングルプローブによる対照実験の必要性を提唱した (Box 1)。

さらに、今後の技術的展望として、RNA干渉 (RNAi) やMassively Parallel Signature Sequencing (MPSS) などの新技術についても言及し、遺伝子発現解析の将来的な方向性を示唆した。本レビューは、既存の文献情報を統合し、遺伝子発現解析技術の歴史的発展と、がん研究におけるその意義を包括的に評価することを目的とした。