Loading...
Revista da Sociedade Brasileira de Medicina Tropical20200101Vol.53issue()

ウェーブレットドメインアプローチを使用したゲノムの類似性の評価

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

はじめに:結核は、世界中の死亡の上位10の原因にリストされています。この病気を引き起こす耐性株は、公衆衛生の緊急事態と健康安全保障の脅威の原因であると考えられてきました。世界保健機関(WHO)が述べたように、約558,000の異なる症例とリファンピシン(最も手術の第一選択薬)に対する耐性と相まって、これまで推定されています。したがって、結核菌(MTB)のゲノムを使用して耐性株を検出するために、ゲノムの異なるレベルの分解(離散非決定ウェーブレット変換)とハルスト指数を関連付けるゲノム類似性の分析のための新しい方法論を提案します。 方法:10個の分析された配列に対応する信号は、GC含有量を評価することによって取得され、次にこれらの信号は、5レベルの分解で4つのヌルモーメントを持つDaubechiesウェーブレットとともに、離散非推定ウェーブレット変換を使用して分解されました。ハースト指数は、5つの異なる方法を使用して、各分解レベルで計算されました。クラスター分析は、ハースト指数について得られた結果を使用して実行されました。 結果:集約された分散、異なる分散、および集約された絶対値法が3つのグループの形成を提示しましたが、PENGおよびR/Sメソッドは2つのグループの形成を提示しました。凝集した分散法は、同様の株間のグループ形成に関して最良の結果を示しました。 結論:離散非推定ウェーブレット変換に関連するハースト指数の評価は、ゲノム配列間の類似性の尺度として使用でき、分析の改良につながります。

はじめに:結核は、世界中の死亡の上位10の原因にリストされています。この病気を引き起こす耐性株は、公衆衛生の緊急事態と健康安全保障の脅威の原因であると考えられてきました。世界保健機関(WHO)が述べたように、約558,000の異なる症例とリファンピシン(最も手術の第一選択薬)に対する耐性と相まって、これまで推定されています。したがって、結核菌(MTB)のゲノムを使用して耐性株を検出するために、ゲノムの異なるレベルの分解(離散非決定ウェーブレット変換)とハルスト指数を関連付けるゲノム類似性の分析のための新しい方法論を提案します。 方法:10個の分析された配列に対応する信号は、GC含有量を評価することによって取得され、次にこれらの信号は、5レベルの分解で4つのヌルモーメントを持つDaubechiesウェーブレットとともに、離散非推定ウェーブレット変換を使用して分解されました。ハースト指数は、5つの異なる方法を使用して、各分解レベルで計算されました。クラスター分析は、ハースト指数について得られた結果を使用して実行されました。 結果:集約された分散、異なる分散、および集約された絶対値法が3つのグループの形成を提示しましたが、PENGおよびR/Sメソッドは2つのグループの形成を提示しました。凝集した分散法は、同様の株間のグループ形成に関して最良の結果を示しました。 結論:離散非推定ウェーブレット変換に関連するハースト指数の評価は、ゲノム配列間の類似性の尺度として使用でき、分析の改良につながります。

INTRODUCTION: Tuberculosis is listed among the top 10 causes of deaths worldwide. The resistant strains causing this disease have been considered to be responsible for public health emergencies and health security threats. As stated by the World Health Organization (WHO), around 558,000 different cases coupled with resistance to rifampicin (the most operative first-line drug) have been estimated to date. Therefore, in order to detect the resistant strains using the genomes of Mycobacterium tuberculosis (MTB), we propose a new methodology for the analysis of genomic similarities that associate the different levels of decomposition of the genome (discrete non-decimated wavelet transform) and the Hurst exponent. METHODS: The signals corresponding to the ten analyzed sequences were obtained by assessing GC content, and then these signals were decomposed using the discrete non-decimated wavelet transform along with the Daubechies wavelet with four null moments at five levels of decomposition. The Hurst exponent was calculated at each decomposition level using five different methods. The cluster analysis was performed using the results obtained for the Hurst exponent. RESULTS: The aggregated variance, differenced aggregated variance, and aggregated absolute value methods presented the formation of three groups, whereas the Peng and R/S methods presented the formation of two groups. The aggregated variance method exhibited the best results with respect to the group formation between similar strains. CONCLUSION: The evaluation of Hurst exponent associated with discrete non-decimated wavelet transform can be used as a measure of similarity between genome sequences, thus leading to a refinement in the analysis.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google