Loading...
PloS one20120101Vol.7issue(9)

サンプル固有の遺伝子セット濃縮分析とマルチタスク学習を使用して、異なるゲノムデータ型を統合するための予測フレームワーク

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Research Support, U.S. Gov't, Non-P.H.S.
概要
Abstract

根の分子的および遺伝的原因を理解すると、複雑な特性を促進することは、ゲノミクスと遺伝学の基本的な課題です。多くの研究が遺伝子発現の変動を使用して複雑な特性を理解していますが、これらの発現変化に寄与する根本的なゲノム変動はよく理解されていません。この研究では、遺伝子発現と遺伝子型データを統合するフレームワークを開発し、発現変化と遺伝子型変異によって駆動される反対の複雑な特性クラスからのサンプル間の生物学的違いを特定しました。このフレームワークは、経路分析とマルチタスク学習を利用して、予測モデルを構築し、関心の複雑な特性に関連する経路を発見します。発現と遺伝子型のデータをシミュレートして、フレームワークの予測能力をテストし、複雑な特性と差別的に発現し、遺伝的に関連する遺伝子を使用した経路をどの程度明らかにしたかを測定しました。マルチタスクモデルの予測性能は、他の同様の方法に匹敵することがわかりました。また、両方のデータセットから濃縮分析スコアを考慮したマルチタスク学習などの方法で、表現型に関連する遺伝的違いと発現の両方の違いがある経路が見つかりました。私たちのフレームワークを使用して、エストロゲン受容体(ER)陽性および陰性の乳がんサンプル間の違いを分析しました。マルチタスクモデルからの上位15の遺伝子セットの分析により、それらはすべてエストロゲン、ステロイド、細胞シグナル伝達、または細胞周期に関連していることが示されました。私たちの研究は、マルチタスク学習が予測精度を向上させないことを示唆していますが、私たちのフレームワークによって生成されたモデルは、複雑な特性の貴重な生物学的経路の知識を提供します。

根の分子的および遺伝的原因を理解すると、複雑な特性を促進することは、ゲノミクスと遺伝学の基本的な課題です。多くの研究が遺伝子発現の変動を使用して複雑な特性を理解していますが、これらの発現変化に寄与する根本的なゲノム変動はよく理解されていません。この研究では、遺伝子発現と遺伝子型データを統合するフレームワークを開発し、発現変化と遺伝子型変異によって駆動される反対の複雑な特性クラスからのサンプル間の生物学的違いを特定しました。このフレームワークは、経路分析とマルチタスク学習を利用して、予測モデルを構築し、関心の複雑な特性に関連する経路を発見します。発現と遺伝子型のデータをシミュレートして、フレームワークの予測能力をテストし、複雑な特性と差別的に発現し、遺伝的に関連する遺伝子を使用した経路をどの程度明らかにしたかを測定しました。マルチタスクモデルの予測性能は、他の同様の方法に匹敵することがわかりました。また、両方のデータセットから濃縮分析スコアを考慮したマルチタスク学習などの方法で、表現型に関連する遺伝的違いと発現の両方の違いがある経路が見つかりました。私たちのフレームワークを使用して、エストロゲン受容体(ER)陽性および陰性の乳がんサンプル間の違いを分析しました。マルチタスクモデルからの上位15の遺伝子セットの分析により、それらはすべてエストロゲン、ステロイド、細胞シグナル伝達、または細胞周期に関連していることが示されました。私たちの研究は、マルチタスク学習が予測精度を向上させないことを示唆していますが、私たちのフレームワークによって生成されたモデルは、複雑な特性の貴重な生物学的経路の知識を提供します。

Understanding the root molecular and genetic causes driving complex traits is a fundamental challenge in genomics and genetics. Numerous studies have used variation in gene expression to understand complex traits, but the underlying genomic variation that contributes to these expression changes is not well understood. In this study, we developed a framework to integrate gene expression and genotype data to identify biological differences between samples from opposing complex trait classes that are driven by expression changes and genotypic variation. This framework utilizes pathway analysis and multi-task learning to build a predictive model and discover pathways relevant to the complex trait of interest. We simulated expression and genotype data to test the predictive ability of our framework and to measure how well it uncovered pathways with genes both differentially expressed and genetically associated with a complex trait. We found that the predictive performance of the multi-task model was comparable to other similar methods. Also, methods like multi-task learning that considered enrichment analysis scores from both data sets found pathways with both genetic and expression differences related to the phenotype. We used our framework to analyze differences between estrogen receptor (ER) positive and negative breast cancer samples. An analysis of the top 15 gene sets from the multi-task model showed they were all related to estrogen, steroids, cell signaling, or the cell cycle. Although our study suggests that multi-task learning does not enhance predictive accuracy, the models generated by our framework do provide valuable biological pathway knowledge for complex traits.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google