著名医師による解説が無料で読めます
すると翻訳の精度が向上します
動機:単一ヌクレオチド多型を含む非コーディングの遺伝的変異体の増加は、複雑な人間の特性や疾患に関連していることがわかります。それらの機械的解釈は比較的限られており、エピジェネティックプロファイルに対する効果の計算予測からヘルプを使用できます。ただし、現在のモデルは、しばしば局所的な1Dゲノム配列決定因子に焦点を当て、エピジェネティックなイベントに重大な影響を与えるグローバルな3Dクロマチン構造を無視します。 結果:エピジェネティックプロファイルの予期しない高い類似性の非コードバリアントは、局所シーケンスの比較的低い類似性に関して、クロマチン構造の近接性に大きく起因する可能性があることがわかります。したがって、非コーディングバリアント効果を予測するために、1Dゲノム配列のデータと3Dクロマチン構造の両方を組み込んだマルチモーダルディープラーニングスキームを開発しました。具体的には、最近のDNA言語モデルを利用しながら、2種類のデータ間の解像度ギャップにもかかわらず、シーケンス埋め込みおよび構造埋め込みのニューラルネットワークをグラフ化するための畳み込みおよび再発性ニューラルネットワークを統合しました。数値結果は、モデルがエピジェネティックプロファイルを予測する際に競合するシーケンスのみのモデルよりも優れていることを示しています。また、長距離相互作用が調節モチーフを抽出する際の補体シーケンスのみのモデルを使用します。彼らは、監視されていない「ゼロショット」学習であろうと、監督された「少数の」学習であろうと、遺伝子発現と病原性における非コード変異効果の優れた予測因子であることが証明されています。 可用性と実装:コードとデータには、https://github.com/shen-lab/ncvarpred-1d3dおよびhttps://zenodo.org/record/7975777でアクセスできます。
動機:単一ヌクレオチド多型を含む非コーディングの遺伝的変異体の増加は、複雑な人間の特性や疾患に関連していることがわかります。それらの機械的解釈は比較的限られており、エピジェネティックプロファイルに対する効果の計算予測からヘルプを使用できます。ただし、現在のモデルは、しばしば局所的な1Dゲノム配列決定因子に焦点を当て、エピジェネティックなイベントに重大な影響を与えるグローバルな3Dクロマチン構造を無視します。 結果:エピジェネティックプロファイルの予期しない高い類似性の非コードバリアントは、局所シーケンスの比較的低い類似性に関して、クロマチン構造の近接性に大きく起因する可能性があることがわかります。したがって、非コーディングバリアント効果を予測するために、1Dゲノム配列のデータと3Dクロマチン構造の両方を組み込んだマルチモーダルディープラーニングスキームを開発しました。具体的には、最近のDNA言語モデルを利用しながら、2種類のデータ間の解像度ギャップにもかかわらず、シーケンス埋め込みおよび構造埋め込みのニューラルネットワークをグラフ化するための畳み込みおよび再発性ニューラルネットワークを統合しました。数値結果は、モデルがエピジェネティックプロファイルを予測する際に競合するシーケンスのみのモデルよりも優れていることを示しています。また、長距離相互作用が調節モチーフを抽出する際の補体シーケンスのみのモデルを使用します。彼らは、監視されていない「ゼロショット」学習であろうと、監督された「少数の」学習であろうと、遺伝子発現と病原性における非コード変異効果の優れた予測因子であることが証明されています。 可用性と実装:コードとデータには、https://github.com/shen-lab/ncvarpred-1d3dおよびhttps://zenodo.org/record/7975777でアクセスできます。
MOTIVATION: A growing amount of noncoding genetic variants, including single-nucleotide polymorphisms, are found to be associated with complex human traits and diseases. Their mechanistic interpretation is relatively limited and can use the help from computational prediction of their effects on epigenetic profiles. However, current models often focus on local, 1D genome sequence determinants and disregard global, 3D chromatin structure that critically affects epigenetic events. RESULTS: We find that noncoding variants of unexpected high similarity in epigenetic profiles, with regards to their relatively low similarity in local sequences, can be largely attributed to their proximity in chromatin structure. Accordingly, we have developed a multimodal deep learning scheme that incorporates both data of 1D genome sequence and 3D chromatin structure for predicting noncoding variant effects. Specifically, we have integrated convolutional and recurrent neural networks for sequence embedding and graph neural networks for structure embedding despite the resolution gap between the two types of data, while utilizing recent DNA language models. Numerical results show that our models outperform competing sequence-only models in predicting epigenetic profiles and their use of long-range interactions complement sequence-only models in extracting regulatory motifs. They prove to be excellent predictors for noncoding variant effects in gene expression and pathogenicity, whether in unsupervised "zero-shot" learning or supervised "few-shot" learning. AVAILABILITY AND IMPLEMENTATION: Codes and data can be accessed at https://github.com/Shen-Lab/ncVarPred-1D3D and https://zenodo.org/record/7975777.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。