Loading...
Bioinformatics (Oxford, England)2022Jan27Vol.38issue(4)

T2-DAG:グラフに基づいた構造方程式モデリングを介した差次的に発現した遺伝子経路の強力なテスト

,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

動機:遺伝的研究における主要な課題は、遺伝的突然変異の機能的特性を理解し、患者の診断を強化するために、ヒト疾患と特性に関連する遺伝子を特定することです。個々の遺伝子の限界分析、遺伝子経路の同定、つまり特定の生物学的機能に集合的に寄与する既知の相互作用を持つ一連の遺伝子は、より生物学的に意味のある結果を提供できます。このような遺伝子経路分析は、高次元の2サンプルテストの問題に定式化できます。遺伝子発現データセットのサンプルサイズが一般的に限られていることを考えると、ほとんどの既存の2サンプルテストは、遺伝子相互作用に関する補助経路情報を無視するか、非効率的にしか組み込んでいるため、パワーを損なう傾向があります。 結果:差次的に発現した遺伝子経路を検出するためのホテルのT2型テストであるT2-DAGを提案します。これは、線形構造方程式モデルを介して既存の経路データベースからの遺伝子相互作用に関する補助経路情報を効率的に活用します。さらに、適切な仮定の下で漸近分布を確立します。さまざまなシナリオでのシミュレーション研究は、T2-DAGが、不完全または不正確な経路情報または未調整の交絡効果であっても、よく制御されたタイプIエラー率と大幅に改善されたパワーを備えたいくつかの代表的な既存の方法を上回ることを示しています。また、肺がんの異なる段階間で差次的に発現したKEGG経路を検出するためのアプリケーションでのT2-DAGの性能を説明します。 可用性と実装:提案されたT2-DAGテストを実装するR(R Development Core Team、2021)パッケージT2DAGは、https://github.com/jin93/t2dagのGithubで入手できます。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

動機:遺伝的研究における主要な課題は、遺伝的突然変異の機能的特性を理解し、患者の診断を強化するために、ヒト疾患と特性に関連する遺伝子を特定することです。個々の遺伝子の限界分析、遺伝子経路の同定、つまり特定の生物学的機能に集合的に寄与する既知の相互作用を持つ一連の遺伝子は、より生物学的に意味のある結果を提供できます。このような遺伝子経路分析は、高次元の2サンプルテストの問題に定式化できます。遺伝子発現データセットのサンプルサイズが一般的に限られていることを考えると、ほとんどの既存の2サンプルテストは、遺伝子相互作用に関する補助経路情報を無視するか、非効率的にしか組み込んでいるため、パワーを損なう傾向があります。 結果:差次的に発現した遺伝子経路を検出するためのホテルのT2型テストであるT2-DAGを提案します。これは、線形構造方程式モデルを介して既存の経路データベースからの遺伝子相互作用に関する補助経路情報を効率的に活用します。さらに、適切な仮定の下で漸近分布を確立します。さまざまなシナリオでのシミュレーション研究は、T2-DAGが、不完全または不正確な経路情報または未調整の交絡効果であっても、よく制御されたタイプIエラー率と大幅に改善されたパワーを備えたいくつかの代表的な既存の方法を上回ることを示しています。また、肺がんの異なる段階間で差次的に発現したKEGG経路を検出するためのアプリケーションでのT2-DAGの性能を説明します。 可用性と実装:提案されたT2-DAGテストを実装するR(R Development Core Team、2021)パッケージT2DAGは、https://github.com/jin93/t2dagのGithubで入手できます。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

MOTIVATION: A major task in genetic studies is to identify genes related to human diseases and traits to understand functional characteristics of genetic mutations and enhance patient diagnosis. Compared with marginal analyses of individual genes, identification of gene pathways, i.e. a set of genes with known interactions that collectively contribute to specific biological functions, can provide more biologically meaningful results. Such gene pathway analysis can be formulated into a high-dimensional two-sample testing problem. Given the typically limited sample size of gene expression datasets, most existing two-sample tests tend to have compromised powers because they ignore or only inefficiently incorporate the auxiliary pathway information on gene interactions. RESULTS: We propose T2-DAG, a Hotelling's T2-type test for detecting differentially expressed gene pathways, which efficiently leverages the auxiliary pathway information on gene interactions from existing pathway databases through a linear structural equation model. We further establish its asymptotic distribution under pertinent assumptions. Simulation studies under various scenarios show that T2-DAG outperforms several representative existing methods with well-controlled type-I error rates and substantially improved powers, even with incomplete or inaccurate pathway information or unadjusted confounding effects. We also illustrate the performance of T2-DAG in an application to detect differentially expressed KEGG pathways between different stages of lung cancer. AVAILABILITY AND IMPLEMENTATION: The R (R Development Core Team, 2021) package T2DAG which implements the proposed T2-DAG test is available on Github at https://github.com/Jin93/T2DAG. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google