Loading...
PloS one20150101Vol.10issue(7)

新しいバイオマーカーの発見は乳がんの固有のサブタイプ予測を改善し、メタブリックデータセットのラベルを調整します

,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:乳がんの内因性サブタイプの予測は、患者の診断と予後、および治療反応を決定するための貴重な戦略として導入されています。50遺伝子の発現レベルに基づいたPAM50メソッドは、単一のサンプル予測モデルを使用して、サブタイプラベルをサンプルに割り当てます。このアッセイ内で報告されている固有のエラーは、乳がん群を特定して理解するという課題を示しています。この研究では、a)CM1スコアという名前の新たに提案された方法の能力を調査することにより、サブタイプの個性化の新しいバイオマーカーを特定し、b)サンプルサブタイプの単一分類子の使用とは対照的に、アンサンブル学習を適用することを目指しています。割り当て。包括的な目的は、クラスの予測を改善することです。 方法と調査結果:この研究で使用されているマイクロアレイトランスクリプトームデータセットは、2000人以上の患者に対して記録されたメタブリック乳がんデータと、1570のサンプルを備えたROCKデータベースの公共統合ソースです。最初にCM1スコアを計算して、各固有のサブタイプのサンプル全体で高度に識別的な発現パターンを持つプローブを識別しました。さらに、Wekaソフトウェアスイートの24の異なる分類子を使用して、正しいサブタイプラベルを割り当てる際に、選択された42のプローブの能力を評価しました。比較のために、PAM50メソッドの50の遺伝子のリストに同じ方法が適用されました。 結論:CM1スコアは、乳がんサブタイプを予測するための30の新規バイオマーカーを描写し、12の十分に確立された遺伝子の役割を確認しました。CM1リストと分類子のアンサンブルを使用して割り当てられた固有のサブタイプは、元のPAM50ラベルよりも一貫性があり均質です。新しいサブタイプは、現在の臨床マーカーER、PR、HER2の正確な分布と、メタブリックおよびロックデータセットの生存曲線を示しています。驚くべきことに、元のラベルの逆説的な帰属は、乳がんの固有サブタイプを予測するために単一のサンプル分類子を採用することの制限を強化します。

背景:乳がんの内因性サブタイプの予測は、患者の診断と予後、および治療反応を決定するための貴重な戦略として導入されています。50遺伝子の発現レベルに基づいたPAM50メソッドは、単一のサンプル予測モデルを使用して、サブタイプラベルをサンプルに割り当てます。このアッセイ内で報告されている固有のエラーは、乳がん群を特定して理解するという課題を示しています。この研究では、a)CM1スコアという名前の新たに提案された方法の能力を調査することにより、サブタイプの個性化の新しいバイオマーカーを特定し、b)サンプルサブタイプの単一分類子の使用とは対照的に、アンサンブル学習を適用することを目指しています。割り当て。包括的な目的は、クラスの予測を改善することです。 方法と調査結果:この研究で使用されているマイクロアレイトランスクリプトームデータセットは、2000人以上の患者に対して記録されたメタブリック乳がんデータと、1570のサンプルを備えたROCKデータベースの公共統合ソースです。最初にCM1スコアを計算して、各固有のサブタイプのサンプル全体で高度に識別的な発現パターンを持つプローブを識別しました。さらに、Wekaソフトウェアスイートの24の異なる分類子を使用して、正しいサブタイプラベルを割り当てる際に、選択された42のプローブの能力を評価しました。比較のために、PAM50メソッドの50の遺伝子のリストに同じ方法が適用されました。 結論:CM1スコアは、乳がんサブタイプを予測するための30の新規バイオマーカーを描写し、12の十分に確立された遺伝子の役割を確認しました。CM1リストと分類子のアンサンブルを使用して割り当てられた固有のサブタイプは、元のPAM50ラベルよりも一貫性があり均質です。新しいサブタイプは、現在の臨床マーカーER、PR、HER2の正確な分布と、メタブリックおよびロックデータセットの生存曲線を示しています。驚くべきことに、元のラベルの逆説的な帰属は、乳がんの固有サブタイプを予測するために単一のサンプル分類子を採用することの制限を強化します。

BACKGROUND: The prediction of breast cancer intrinsic subtypes has been introduced as a valuable strategy to determine patient diagnosis and prognosis, and therapy response. The PAM50 method, based on the expression levels of 50 genes, uses a single sample predictor model to assign subtype labels to samples. Intrinsic errors reported within this assay demonstrate the challenge of identifying and understanding the breast cancer groups. In this study, we aim to: a) identify novel biomarkers for subtype individuation by exploring the competence of a newly proposed method named CM1 score, and b) apply an ensemble learning, as opposed to the use of a single classifier, for sample subtype assignment. The overarching objective is to improve class prediction. METHODS AND FINDINGS: The microarray transcriptome data sets used in this study are: the METABRIC breast cancer data recorded for over 2000 patients, and the public integrated source from ROCK database with 1570 samples. We first computed the CM1 score to identify the probes with highly discriminative patterns of expression across samples of each intrinsic subtype. We further assessed the ability of 42 selected probes on assigning correct subtype labels using 24 different classifiers from the Weka software suite. For comparison, the same method was applied on the list of 50 genes from the PAM50 method. CONCLUSIONS: The CM1 score portrayed 30 novel biomarkers for predicting breast cancer subtypes, with the confirmation of the role of 12 well-established genes. Intrinsic subtypes assigned using the CM1 list and the ensemble of classifiers are more consistent and homogeneous than the original PAM50 labels. The new subtypes show accurate distributions of current clinical markers ER, PR and HER2, and survival curves in the METABRIC and ROCK data sets. Remarkably, the paradoxical attribution of the original labels reinforces the limitations of employing a single sample classifiers to predict breast cancer intrinsic subtypes.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google