著名医師による解説が無料で読めます
すると翻訳の精度が向上します
ヒト内因性レトロウイルス(HERV)は、癌や他の疾患の進行に関与する可能性のある活性レトロウイルスタンパク質をコードします。レトロウイルスのグループ特異的抗原遺伝子(GAG)のマトリックスタンパク質(MA)は、ほとんどの哺乳類のレトロウイルスにおけるウイルスエンベロープ糖タンパク質に関連しており、ウイルス粒子のアセンブリ、輸送、出芽に関与している可能性があります。ただし、ERVSの注釈付きMASの量は、これまでのところまだ低レベルです。GAGSのMASの正確な開始座標と終了座標を予測する計算方法はまだ提案されていません。この論文では、ERVSのMASを識別する計算方法が提案されています。分裂と征服の手法が設計され、従来の予測モデルに適用され、さまざまな長さの遺伝子配列を扱う際により良い結果を得ました。開始部位と終了部位は、個別に予測され、その間隔に従って結合されました。3つの異なるアルゴリズムが適用され、比較されました:加重サポートベクターマシン(WSVM)、加重極端な学習マシン(WELM)、ランダムフォレスト(RF)。G-ランダムフォレストモデルによって生成された5倍のクロス検証の下での開始部位と終端部位の平均(感度と特異性の幾何平均)値は、それぞれ0.9869および0.9755であり、適用されたアルゴリズムの中で最高です。予測モデルはRF&WSVMアルゴリズムを組み合わせて、最良の予測結果を実現します。完全なMAS(合計125)の収集されたすべてのERVシーケンスの98.4%は、モデルによって正確に正しいと予測できます。118の家族からの94,671 HERVシーケンスがモデルによってスキャンされ、ヒト染色体では104の新しい推定MASが予測されました。推定MASの分布とモデルパラメーターの最適化も分析されました。予測方法の使用も他のレトロウイルスに拡張され、満足のいく結果が得られました。
ヒト内因性レトロウイルス(HERV)は、癌や他の疾患の進行に関与する可能性のある活性レトロウイルスタンパク質をコードします。レトロウイルスのグループ特異的抗原遺伝子(GAG)のマトリックスタンパク質(MA)は、ほとんどの哺乳類のレトロウイルスにおけるウイルスエンベロープ糖タンパク質に関連しており、ウイルス粒子のアセンブリ、輸送、出芽に関与している可能性があります。ただし、ERVSの注釈付きMASの量は、これまでのところまだ低レベルです。GAGSのMASの正確な開始座標と終了座標を予測する計算方法はまだ提案されていません。この論文では、ERVSのMASを識別する計算方法が提案されています。分裂と征服の手法が設計され、従来の予測モデルに適用され、さまざまな長さの遺伝子配列を扱う際により良い結果を得ました。開始部位と終了部位は、個別に予測され、その間隔に従って結合されました。3つの異なるアルゴリズムが適用され、比較されました:加重サポートベクターマシン(WSVM)、加重極端な学習マシン(WELM)、ランダムフォレスト(RF)。G-ランダムフォレストモデルによって生成された5倍のクロス検証の下での開始部位と終端部位の平均(感度と特異性の幾何平均)値は、それぞれ0.9869および0.9755であり、適用されたアルゴリズムの中で最高です。予測モデルはRF&WSVMアルゴリズムを組み合わせて、最良の予測結果を実現します。完全なMAS(合計125)の収集されたすべてのERVシーケンスの98.4%は、モデルによって正確に正しいと予測できます。118の家族からの94,671 HERVシーケンスがモデルによってスキャンされ、ヒト染色体では104の新しい推定MASが予測されました。推定MASの分布とモデルパラメーターの最適化も分析されました。予測方法の使用も他のレトロウイルスに拡張され、満足のいく結果が得られました。
Human endogenous retroviruses (HERVs) encode active retroviral proteins, which may be involved in the progression of cancer and other diseases. Matrix protein (MA), in group-specific antigen genes (gag) of retroviruses, is associated with the virus envelope glycoproteins in most mammalian retroviruses and may be involved in virus particle assembly, transport and budding. However, the amount of annotated MAs in ERVs is still at a low level so far. No computational method to predict the exact start and end coordinates of MAs in gags has been proposed yet. In this paper, a computational method to identify MAs in ERVs is proposed. A divide and conquer technique was designed and applied to the conventional prediction model to acquire better results when dealing with gene sequences with various lengths. Initiation sites and termination sites were predicted separately and then combined according to their intervals. Three different algorithms were applied and compared: weighted support vector machine (WSVM), weighted extreme learning machine (WELM) and random forest (RF). G - mean (geometric mean of sensitivity and specificity) values of initiation sites and termination sites under 5-fold cross validation generated by random forest models are 0.9869 and 0.9755 respectively, highest among the algorithms applied. Our prediction models combine RF & WSVM algorithms to achieve the best prediction results. 98.4% of all the collected ERV sequences with complete MAs (125 in total) could be predicted exactly correct by the models. 94,671 HERV sequences from 118 families were scanned by the model, 104 new putative MAs were predicted in human chromosomes. Distributions of the putative MAs and optimizations of model parameters were also analyzed. The usage of our predicting method was also expanded to other retroviruses and satisfying results were acquired.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。