Loading...
BMC bioinformatics2022Jan14Vol.23issue(1)

ECCSPLORER:次世代シーケンスデータから染色体外循環DNA(ECCDNA)を検出するパイプライン

,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景:染色体外循環DNA(ECCDNA)は、サイズが100 bpの染色体から物理的に分離されたリング状のDNA構造です。ECCDNAは、タンデムの繰り返しDNAを運ぶこととは別に、遺伝子の追加コピーまたは最近活性化された転位要素を抱えている場合があります。これまで調査されたすべての真核生物でECCDNAが発生し、ストレス、癌、および老化において役割を果たす可能性が高いため、計算ツールの不足によって制限されている調査で最近の研究で主要な標的となっています。 結果:ここでは、次世代シーケンス技術を使用して、あらゆる種類の生物または組織のECCDNAを検出するためのバイオインフォマティクスパイプラインであるEccsplorerを提示します。増幅された円形DNA(circseq)のイルミナシーケンスに続いて、ECCSplorerはECCDNA候補の簡単で自動化された発見を可能にします。データ分析には、2つの主要な手順が含まれます。まず、参照ゲノムへの読み取りマッピングにより、高いカバレッジ、不一致マッピング、および分割読み取りを含む有益な読み取り分布の検出が可能になります。第二に、増幅されたeccDNAからの読み取りクラスターのコントロールサンプルデータとの参照の比較は、特異的に濃縮されたDNAサークルを明らかにします。両方のソフトウェアパーツは、個々の目的またはデータの可用性に応じて、個別にまたは共同で実行できます。私たちのアプローチの幅広い適用性を説明するために、モデル生物Homo SapiensおよびArabidopsis Thalianaからの半建設的および公開されたcircseqデータを分析し、非モデル作物植物植物のvulgarisからcircseq読み取りを生成しました。参照ゲノムの有無にかかわらず、すべてのデータセットのeccDNA候補を明確に特定しました。Eccsplorerパイプラインは、ミトコンドリアのミニサーキルとレトロトランスポゾンの活性化を具体的に検出し、Eccsplorerの感度と特異性を示しました。 結論:ECCSPLORER(https://github.com/crimbubble/eccsplorerでオンラインで入手可能)は、次世代シーケンスデータを使用して、あらゆる種類の生物または組織のECCDNAを検出するバイオインフォマティクスパイプラインです。派生したeccDNAターゲットは、オルガネラゲノミクスを介したがん関連のECCDNAの幅広い下流の調査から、能動的転位要素の同定に至るまで価値があります。

背景:染色体外循環DNA(ECCDNA)は、サイズが100 bpの染色体から物理的に分離されたリング状のDNA構造です。ECCDNAは、タンデムの繰り返しDNAを運ぶこととは別に、遺伝子の追加コピーまたは最近活性化された転位要素を抱えている場合があります。これまで調査されたすべての真核生物でECCDNAが発生し、ストレス、癌、および老化において役割を果たす可能性が高いため、計算ツールの不足によって制限されている調査で最近の研究で主要な標的となっています。 結果:ここでは、次世代シーケンス技術を使用して、あらゆる種類の生物または組織のECCDNAを検出するためのバイオインフォマティクスパイプラインであるEccsplorerを提示します。増幅された円形DNA(circseq)のイルミナシーケンスに続いて、ECCSplorerはECCDNA候補の簡単で自動化された発見を可能にします。データ分析には、2つの主要な手順が含まれます。まず、参照ゲノムへの読み取りマッピングにより、高いカバレッジ、不一致マッピング、および分割読み取りを含む有益な読み取り分布の検出が可能になります。第二に、増幅されたeccDNAからの読み取りクラスターのコントロールサンプルデータとの参照の比較は、特異的に濃縮されたDNAサークルを明らかにします。両方のソフトウェアパーツは、個々の目的またはデータの可用性に応じて、個別にまたは共同で実行できます。私たちのアプローチの幅広い適用性を説明するために、モデル生物Homo SapiensおよびArabidopsis Thalianaからの半建設的および公開されたcircseqデータを分析し、非モデル作物植物植物のvulgarisからcircseq読み取りを生成しました。参照ゲノムの有無にかかわらず、すべてのデータセットのeccDNA候補を明確に特定しました。Eccsplorerパイプラインは、ミトコンドリアのミニサーキルとレトロトランスポゾンの活性化を具体的に検出し、Eccsplorerの感度と特異性を示しました。 結論:ECCSPLORER(https://github.com/crimbubble/eccsplorerでオンラインで入手可能)は、次世代シーケンスデータを使用して、あらゆる種類の生物または組織のECCDNAを検出するバイオインフォマティクスパイプラインです。派生したeccDNAターゲットは、オルガネラゲノミクスを介したがん関連のECCDNAの幅広い下流の調査から、能動的転位要素の同定に至るまで価値があります。

BACKGROUND: Extrachromosomal circular DNAs (eccDNAs) are ring-like DNA structures physically separated from the chromosomes with 100 bp to several megabasepairs in size. Apart from carrying tandemly repeated DNA, eccDNAs may also harbor extra copies of genes or recently activated transposable elements. As eccDNAs occur in all eukaryotes investigated so far and likely play roles in stress, cancer, and aging, they have been prime targets in recent research-with their investigation limited by the scarcity of computational tools. RESULTS: Here, we present the ECCsplorer, a bioinformatics pipeline to detect eccDNAs in any kind of organism or tissue using next-generation sequencing techniques. Following Illumina-sequencing of amplified circular DNA (circSeq), the ECCsplorer enables an easy and automated discovery of eccDNA candidates. The data analysis encompasses two major procedures: first, read mapping to the reference genome allows the detection of informative read distributions including high coverage, discordant mapping, and split reads. Second, reference-free comparison of read clusters from amplified eccDNA against control sample data reveals specifically enriched DNA circles. Both software parts can be run separately or jointly, depending on the individual aim or data availability. To illustrate the wide applicability of our approach, we analyzed semi-artificial and published circSeq data from the model organisms Homo sapiens and Arabidopsis thaliana, and generated circSeq reads from the non-model crop plant Beta vulgaris. We clearly identified eccDNA candidates from all datasets, with and without reference genomes. The ECCsplorer pipeline specifically detected mitochondrial mini-circles and retrotransposon activation, showcasing the ECCsplorer's sensitivity and specificity. CONCLUSION: The ECCsplorer (available online at https://github.com/crimBubble/ECCsplorer ) is a bioinformatics pipeline to detect eccDNAs in any kind of organism or tissue using next-generation sequencing data. The derived eccDNA targets are valuable for a wide range of downstream investigations-from analysis of cancer-related eccDNAs over organelle genomics to identification of active transposable elements.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google