Loading...
Scientific reports2021Apr22Vol.11issue(1)

マイクロアレイおよびRNAシーケンスデータの統合分析による肺腺癌および扁平上皮癌における転写サブタイプの同定

,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

腫瘍のサブタイプへの分類は、標的療法の選択を含む、治療へのパーソナライズされたアプローチを知らせることができます。2つの最も一般的な肺がん組織学的サブタイプである肺腺癌および肺扁平上皮癌は、以前はマイクロアレイデータを使用して転写サブタイプに分割されており、その後、RNA-seqデータを分類するために対応するシグネチャを使用しました。クロスプラットフォームの非監視なし分類は、膨大な量の公開されているマイクロアレイとRNA-seqデータを組み合わせることにより、堅牢な転写サブタイプの識別を促進します。ただし、2つの遺伝子発現プロファイリング技術を使用して生成されたデータの本質的な違いのため、クロスプラットフォーム分類は困難です。このレポートでは、2つの広く使用されているプラ​​ットフォーム、Affymetrix HG-U133プラス2.0アレイとイルミナHiseq RNAシーケンスを使用してプロファイルされた3500以上の正常および腫瘍肺サンプルを表す統合データで堅牢な遺伝子発現サブタイプが特定できることを示しています。データ処理方法の384の組み合わせのコンセンサスクラスタリングをテストおよび分析しました。シングルプラットフォームとクロスプラットフォームの正規化データで特定されたサブタイプ間の一致は、さまざまな統計を使用して評価されました。結果は、選択された前処理、クロスプラットフォーム正規化、および教師なし機能選択方法を使用して、マイクロアレイとRNA-Seqの組み合わせデータを使用して、監視されていない学習を実現できることを示しています。私たちの分析により、3つの肺腺癌転写サブタイプが確認されましたが、以前に特定された4つのサブタイプとは対照的に、扁平上皮癌には2つの一貫したサブタイプのみが確認されました。さらなる分析により、腫瘍サブタイプは、治療標的をコードする遺伝子のゲノム変化の異なるパターンと関連していることが示されました。重要なことに、定量的プロテオミクスデータを統合することにより、遺伝子とタンパク質の両方の発現に基づいてサンプルを効果的に分類する腫瘍サブタイプバイオマーカーを特定することができました。この研究は、遺伝子およびタンパク質発現プロファイリングプラットフォーム間のさらなる統合データ分析の基礎を提供します。

腫瘍のサブタイプへの分類は、標的療法の選択を含む、治療へのパーソナライズされたアプローチを知らせることができます。2つの最も一般的な肺がん組織学的サブタイプである肺腺癌および肺扁平上皮癌は、以前はマイクロアレイデータを使用して転写サブタイプに分割されており、その後、RNA-seqデータを分類するために対応するシグネチャを使用しました。クロスプラットフォームの非監視なし分類は、膨大な量の公開されているマイクロアレイとRNA-seqデータを組み合わせることにより、堅牢な転写サブタイプの識別を促進します。ただし、2つの遺伝子発現プロファイリング技術を使用して生成されたデータの本質的な違いのため、クロスプラットフォーム分類は困難です。このレポートでは、2つの広く使用されているプラ​​ットフォーム、Affymetrix HG-U133プラス2.0アレイとイルミナHiseq RNAシーケンスを使用してプロファイルされた3500以上の正常および腫瘍肺サンプルを表す統合データで堅牢な遺伝子発現サブタイプが特定できることを示しています。データ処理方法の384の組み合わせのコンセンサスクラスタリングをテストおよび分析しました。シングルプラットフォームとクロスプラットフォームの正規化データで特定されたサブタイプ間の一致は、さまざまな統計を使用して評価されました。結果は、選択された前処理、クロスプラットフォーム正規化、および教師なし機能選択方法を使用して、マイクロアレイとRNA-Seqの組み合わせデータを使用して、監視されていない学習を実現できることを示しています。私たちの分析により、3つの肺腺癌転写サブタイプが確認されましたが、以前に特定された4つのサブタイプとは対照的に、扁平上皮癌には2つの一貫したサブタイプのみが確認されました。さらなる分析により、腫瘍サブタイプは、治療標的をコードする遺伝子のゲノム変化の異なるパターンと関連していることが示されました。重要なことに、定量的プロテオミクスデータを統合することにより、遺伝子とタンパク質の両方の発現に基づいてサンプルを効果的に分類する腫瘍サブタイプバイオマーカーを特定することができました。この研究は、遺伝子およびタンパク質発現プロファイリングプラットフォーム間のさらなる統合データ分析の基礎を提供します。

Classification of tumors into subtypes can inform personalized approaches to treatment including the choice of targeted therapies. The two most common lung cancer histological subtypes, lung adenocarcinoma and lung squamous cell carcinoma, have been previously divided into transcriptional subtypes using microarray data, and corresponding signatures were subsequently used to classify RNA-seq data. Cross-platform unsupervised classification facilitates the identification of robust transcriptional subtypes by combining vast amounts of publicly available microarray and RNA-seq data. However, cross-platform classification is challenging because of intrinsic differences in data generated using the two gene expression profiling technologies. In this report, we show that robust gene expression subtypes can be identified in integrated data representing over 3500 normal and tumor lung samples profiled using two widely used platforms, Affymetrix HG-U133 Plus 2.0 Array and Illumina HiSeq RNA sequencing. We tested and analyzed consensus clustering for 384 combinations of data processing methods. The agreement between subtypes identified in single-platform and cross-platform normalized data was then evaluated using a variety of statistics. Results show that unsupervised learning can be achieved with combined microarray and RNA-seq data using selected preprocessing, cross-platform normalization, and unsupervised feature selection methods. Our analysis confirmed three lung adenocarcinoma transcriptional subtypes, but only two consistent subtypes in squamous cell carcinoma, as opposed to four subtypes previously identified. Further analysis showed that tumor subtypes were associated with distinct patterns of genomic alterations in genes coding for therapeutic targets. Importantly, by integrating quantitative proteomics data, we were able to identify tumor subtype biomarkers that effectively classify samples on the basis of both gene and protein expression. This study provides the basis for further integrative data analysis across gene and protein expression profiling platforms.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google