著名医師による解説が無料で読めます
すると翻訳の精度が向上します
動機:患者サブタイピングと呼ばれる同様の特徴を持つ患者の亜集団の特定は、精密医学の目標を実現するために重要です。正確なサブタイピングは、死亡率の低下と罹患率につながる可能性のある治療戦略を調整するために重要です。ガウス混合モデルなどのモデルベースのクラスタリングは、サブタイプを識別するために広く使用されている原則的で解釈可能な方法論を提供します。ただし、各変数に同一の限界分布を課します。このような仮定は、モデリングの柔軟性を制限し、クラスタリングパフォーマンスを低下させます。 結果:このホワイトペーパーでは、コピュラの統計的枠組みを使用して、それらの間の依存関係からの限界のモデリングを分離します。現在のコピュラベースの方法は、パラメーター推論の課題により、高次元にスケーリングできません。これらの課題に対処するHD-GMCMを開発し、私たちの知る限り、高次元データに適合できる最初のコピュラベースのクラスタリング方法です。実際の高次元遺伝子発現と臨床データセットに関する実験は、HD-GMCMが非ガウスデータをモデル化し、ガウスの使用を通じて外れ値に堅牢であることにより、最先端のモデルベースのクラスタリング方法よりも優れていることを示しています。混合コピュラ。TCGAの肺がんデータに関するケーススタディを提示します。HD-GMCMから取得したクラスターは、サブタイプを特徴付ける新しい方法を提供する依存関係に基づいて解釈できます。経験的には、このようなモデリングは、クラスタリングの改善につながる潜在的な構造を明らかにするだけでなく、患者の生存率の観点からも意味のある臨床サブタイプをもたらすだけではありません。 可用性と実装:RでのHD-GMCMの実装は、https://bitbucket.org/cdal/hdgmcm/で入手できます。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。
動機:患者サブタイピングと呼ばれる同様の特徴を持つ患者の亜集団の特定は、精密医学の目標を実現するために重要です。正確なサブタイピングは、死亡率の低下と罹患率につながる可能性のある治療戦略を調整するために重要です。ガウス混合モデルなどのモデルベースのクラスタリングは、サブタイプを識別するために広く使用されている原則的で解釈可能な方法論を提供します。ただし、各変数に同一の限界分布を課します。このような仮定は、モデリングの柔軟性を制限し、クラスタリングパフォーマンスを低下させます。 結果:このホワイトペーパーでは、コピュラの統計的枠組みを使用して、それらの間の依存関係からの限界のモデリングを分離します。現在のコピュラベースの方法は、パラメーター推論の課題により、高次元にスケーリングできません。これらの課題に対処するHD-GMCMを開発し、私たちの知る限り、高次元データに適合できる最初のコピュラベースのクラスタリング方法です。実際の高次元遺伝子発現と臨床データセットに関する実験は、HD-GMCMが非ガウスデータをモデル化し、ガウスの使用を通じて外れ値に堅牢であることにより、最先端のモデルベースのクラスタリング方法よりも優れていることを示しています。混合コピュラ。TCGAの肺がんデータに関するケーススタディを提示します。HD-GMCMから取得したクラスターは、サブタイプを特徴付ける新しい方法を提供する依存関係に基づいて解釈できます。経験的には、このようなモデリングは、クラスタリングの改善につながる潜在的な構造を明らかにするだけでなく、患者の生存率の観点からも意味のある臨床サブタイプをもたらすだけではありません。 可用性と実装:RでのHD-GMCMの実装は、https://bitbucket.org/cdal/hdgmcm/で入手できます。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。
MOTIVATION: The identification of sub-populations of patients with similar characteristics, called patient subtyping, is important for realizing the goals of precision medicine. Accurate subtyping is crucial for tailoring therapeutic strategies that can potentially lead to reduced mortality and morbidity. Model-based clustering, such as Gaussian mixture models, provides a principled and interpretable methodology that is widely used to identify subtypes. However, they impose identical marginal distributions on each variable; such assumptions restrict their modeling flexibility and deteriorates clustering performance. RESULTS: In this paper, we use the statistical framework of copulas to decouple the modeling of marginals from the dependencies between them. Current copula-based methods cannot scale to high dimensions due to challenges in parameter inference. We develop HD-GMCM, that addresses these challenges and, to our knowledge, is the first copula-based clustering method that can fit high-dimensional data. Our experiments on real high-dimensional gene-expression and clinical datasets show that HD-GMCM outperforms state-of-the-art model-based clustering methods, by virtue of modeling non-Gaussian data and being robust to outliers through the use of Gaussian mixture copulas. We present a case study on lung cancer data from TCGA. Clusters obtained from HD-GMCM can be interpreted based on the dependencies they model, that offers a new way of characterizing subtypes. Empirically, such modeling not only uncovers latent structure that leads to better clustering but also meaningful clinical subtypes in terms of survival rates of patients. AVAILABILITY AND IMPLEMENTATION: An implementation of HD-GMCM in R is available at: https://bitbucket.org/cdal/hdgmcm/. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。