Loading...
Genome research2006Sep01Vol.16issue(9)

Symap:FPCマップのシンテニク領域を発見して表示するためのシステム

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, U.S. Gov't, Non-P.H.S.
概要
Abstract

2つのゲノム間で遺伝子と染色体の組織を比較する以前のアプローチは、遺伝子マップまたはゲノム配列に基づいています。FPCベースの物理マップをBACエンドシーケンスとシーケンスタグ付きハイブリダイゼーションマーカーに基づいてゲノムシーケンスに整列させ、共有マーカーと指紋に基づいて2つのFPCマップを互いに整列させるシステムを開発しました。Symap(Syntenyマッピングおよび分析プログラム)と呼ばれるシステムは、シンテニーブロックとWebベースのグラフィックを計算するアルゴリズムで構成され、結果を視覚化します。アンカー(それぞれのマップの対応する要素)を計算するアプローチは、異なる発散率のアンカーを含めることを最大化します。チェーン(アンカーの推定シンテニックセット)は、MAP座標エラーと小さな反転に起因する角質外アンカーを含む動的プログラミングアルゴリズムを使用して計算されます。ギャップパラメーター(チェーン内のアンカー間で許可される距離)は、データセットによって異なる場合があり、手動で設定するのが難しいため、データセットごとに自動的に計算されます。チェーンを受け入れるための基準は、アンカーの数とピアソン相関係数に基づいています。隣接するチェーンは、ディスプレイのためにシンテニーブロックに統合されます。このアルゴリズムは、BACの数、BACエンドシーケンス、ハイブリダイゼーションマーカー、アンカー間の距離、ゲノム重複イベントの数と古代が異なる3つのデータセットでテストされています。WebベースのグラフィックスはJavaを使用して、ユーザーがSyntenyの証拠を尋問できるようにする非常にインタラクティブなディスプレイを使用します。

2つのゲノム間で遺伝子と染色体の組織を比較する以前のアプローチは、遺伝子マップまたはゲノム配列に基づいています。FPCベースの物理マップをBACエンドシーケンスとシーケンスタグ付きハイブリダイゼーションマーカーに基づいてゲノムシーケンスに整列させ、共有マーカーと指紋に基づいて2つのFPCマップを互いに整列させるシステムを開発しました。Symap(Syntenyマッピングおよび分析プログラム)と呼ばれるシステムは、シンテニーブロックとWebベースのグラフィックを計算するアルゴリズムで構成され、結果を視覚化します。アンカー(それぞれのマップの対応する要素)を計算するアプローチは、異なる発散率のアンカーを含めることを最大化します。チェーン(アンカーの推定シンテニックセット)は、MAP座標エラーと小さな反転に起因する角質外アンカーを含む動的プログラミングアルゴリズムを使用して計算されます。ギャップパラメーター(チェーン内のアンカー間で許可される距離)は、データセットによって異なる場合があり、手動で設定するのが難しいため、データセットごとに自動的に計算されます。チェーンを受け入れるための基準は、アンカーの数とピアソン相関係数に基づいています。隣接するチェーンは、ディスプレイのためにシンテニーブロックに統合されます。このアルゴリズムは、BACの数、BACエンドシーケンス、ハイブリダイゼーションマーカー、アンカー間の距離、ゲノム重複イベントの数と古代が異なる3つのデータセットでテストされています。WebベースのグラフィックスはJavaを使用して、ユーザーがSyntenyの証拠を尋問できるようにする非常にインタラクティブなディスプレイを使用します。

Previous approaches to comparing gene and chromosome organization between two genomes have been based on genetic maps or genomic sequences. We have developed a system to align an FPC-based physical map to a genomic sequence based on BAC end sequences and sequence-tagged hybridization markers and to align two FPC maps to one another based on shared markers and fingerprints. The system, called SyMAP (Synteny Mapping and Analysis Program), consists of an algorithm to compute synteny blocks and Web-based graphics to visualize the results. The approach to calculating the anchors (corresponding elements on the respective maps) maximizes the inclusion of anchors with different rates of divergence. Chains (putative syntenic sets of anchors) are computed using a dynamic programming algorithm, which includes off-diagonal anchors that result from map coordinate errors and small inversions. As the gap parameters (the distances allowed between anchors in a chain) can vary over different data sets and be difficult to set manually, they are automatically computed per data set. The criterion for a chain to be acceptable is based on the number of anchors and the Pearson correlation coefficient. Neighboring chains are merged into synteny blocks for display. This algorithm has been tested with three data sets that vary in the number of BACs, BAC end sequences, hybridization markers, distance between anchors, and number and antiquity of genome duplication events. The Web-based graphics uses Java for a highly interactive display that allows the user to interrogate the evidence of synteny.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google