Loading...
Biostatistics (Oxford, England)2010Apr01Vol.11issue(2)

冷凍堅牢なマルチアレイ分析(FEMA)

,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

堅牢なマルチアレイ分析(RMA)は、Affymetrixおよびニンブルゲン遺伝子発現マイクロアレイで最も広く使用されている前処理アルゴリズムです。RMAは、モジュール式の方法でバックグラウンド補正、正規化、および要約を実行します。最後の2つのステップでは、複数の配列を同時に分析する必要があります。サンプル間で情報を借りる機能は、RMAさまざまな利点を提供します。たとえば、要約ステップは、プローブ効果を説明し、配列全体で固定され、外れ値の検出を改善するパラメトリックモデルに適合します。適合モデルから取得された残差は、有用な品質メトリックの作成を許可します。ただし、複数のアレイへの依存には2つの欠点があります。(1)RMAは、サンプルを個別に処理する必要がある臨床設定または小さなバッチで、(2)個別に前処理されたデータセットは比較できません。前処理アルゴリズムであるFrozen RMA(FRMA)を提案します。これにより、マイクロアレイを個別または小さなバッチで分析し、分析のためにデータを組み合わせることができます。これは、公開されている大規模なマイクロアレイデータベースからの情報を利用することによって実現されます。特に、プローブ固有の効果と分散の推定値は、事前計算および凍結されています。次に、新しいデータセットを使用して、これらは新しい配列の情報と協調して、データを正規化および要約します。データが単一のバッチとして分析され、複数のバッチを分析するときにRMAを上回る場合、FRMAはRMAに匹敵することがわかります。ここで説明する方法はRパッケージFRMAに実装されており、現在http://rafalab.jhsph.eduのソフトウェアセクションからダウンロードできます。

堅牢なマルチアレイ分析(RMA)は、Affymetrixおよびニンブルゲン遺伝子発現マイクロアレイで最も広く使用されている前処理アルゴリズムです。RMAは、モジュール式の方法でバックグラウンド補正、正規化、および要約を実行します。最後の2つのステップでは、複数の配列を同時に分析する必要があります。サンプル間で情報を借りる機能は、RMAさまざまな利点を提供します。たとえば、要約ステップは、プローブ効果を説明し、配列全体で固定され、外れ値の検出を改善するパラメトリックモデルに適合します。適合モデルから取得された残差は、有用な品質メトリックの作成を許可します。ただし、複数のアレイへの依存には2つの欠点があります。(1)RMAは、サンプルを個別に処理する必要がある臨床設定または小さなバッチで、(2)個別に前処理されたデータセットは比較できません。前処理アルゴリズムであるFrozen RMA(FRMA)を提案します。これにより、マイクロアレイを個別または小さなバッチで分析し、分析のためにデータを組み合わせることができます。これは、公開されている大規模なマイクロアレイデータベースからの情報を利用することによって実現されます。特に、プローブ固有の効果と分散の推定値は、事前計算および凍結されています。次に、新しいデータセットを使用して、これらは新しい配列の情報と協調して、データを正規化および要約します。データが単一のバッチとして分析され、複数のバッチを分析するときにRMAを上回る場合、FRMAはRMAに匹敵することがわかります。ここで説明する方法はRパッケージFRMAに実装されており、現在http://rafalab.jhsph.eduのソフトウェアセクションからダウンロードできます。

Robust multiarray analysis (RMA) is the most widely used preprocessing algorithm for Affymetrix and Nimblegen gene expression microarrays. RMA performs background correction, normalization, and summarization in a modular way. The last 2 steps require multiple arrays to be analyzed simultaneously. The ability to borrow information across samples provides RMA various advantages. For example, the summarization step fits a parametric model that accounts for probe effects, assumed to be fixed across arrays, and improves outlier detection. Residuals, obtained from the fitted model, permit the creation of useful quality metrics. However, the dependence on multiple arrays has 2 drawbacks: (1) RMA cannot be used in clinical settings where samples must be processed individually or in small batches and (2) data sets preprocessed separately are not comparable. We propose a preprocessing algorithm, frozen RMA (fRMA), which allows one to analyze microarrays individually or in small batches and then combine the data for analysis. This is accomplished by utilizing information from the large publicly available microarray databases. In particular, estimates of probe-specific effects and variances are precomputed and frozen. Then, with new data sets, these are used in concert with information from the new arrays to normalize and summarize the data. We find that fRMA is comparable to RMA when the data are analyzed as a single batch and outperforms RMA when analyzing multiple batches. The methods described here are implemented in the R package fRMA and are currently available for download from the software section of http://rafalab.jhsph.edu.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google