Loading...
BMC bioinformatics2011Oct28Vol.12issue()

スペクトルカウントクラスタリングとクラスターの存在量を使用したペプチドの定量化の強化

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:質量分析(MS)によるタンパク質発現の定量化は、さまざまなプロテオミクス研究で導入されています。特に、スペクトルカウントやスペクトル特徴分析などの2つのラベルフリーの定量化方法が、さまざまなプロテオーム研究で広く調査されています。両方の方法の基礎は、プロテオームデータベース検索とその後のペプチド保持時間の推定に基づくペプチド同定です。しかし、彼らはしばしば制限的なデータベース検索と液体クロマトグラフィー(LC)保持時間の不正確な推定に悩まされます。さらに、SecestやSpectrastなどのスペクトルライブラリ検索アルゴリズムに基づいた従来のペプチド識別方法は、最高の一致も高得点も高い一致も提供していないことがわかっています。最後に、これらの方法は、標的ペプチドが以前に生成され、データベースまたはスペクトルライブラリに保存されない限り識別できないという意味で制限されています。これらの制限を克服するために、Tandem Spectam spectraの存在を推定するための均一なペプチド(Q-fish)の同一のスペクトルセット(Q-fish)の同一のスペクトルセットを見つけることに基づいた新しい方法を提案します。直感的には、Q-fishメソッドは、既知のタンパク質と新規タンパク質の両方を識別するために、実験スペクトルのすべての可能なペアを比較し、同じペプチドターゲットから複製されたスペクトルをグループ化することにより、識別精度を大幅に向上させます。 結果:ヒト肝細胞癌(HCC)および正常な肝臓組織サンプルから得られたNANO-LC-MS/MSデータにQ-fishを適用して、正常サンプルと疾患サンプルの間で差次的に発現するペプチドを特定しました。MS/MS分析を通じて得られた合計44,318スペクトルの場合、Q-Fishは14,747個のクラスターを生成しました。これらのうち、5,777個のクラスターがHCCサンプルでのみ識別され、通常の組織サンプルでのみ6,648個のクラスターが、HCCおよび正常組織サンプルの両方で2,323個のクラスターが特定されました。1つのサンプルからのみ見られるペプチドクラスターを調査することは興味深いでしょうが、HCCと正常サンプルの両方で同定されたスペクトルクラスターをさらに調べてください。目標は定量的に異なる発現ペプチドを特定して評価することです。次のステップは、HCCと正常な組織サンプルの間に差次的に発現したペプチドを分離するためのベータ双項テストを実行することでした。このテストにより、HCCと正常組織サンプルの間に大幅に異なるスペクトル数がある84個のペプチドが生じました。隔離により50と95のペプチドを独立して特定しましたが、そのうち24ペプチドと56個のペプチドは、ヒト肝臓がんのバイオマーカーが知られていることがわかりました。Q-fishとSequestの結果を比較すると、Q-fishによって22の差次的に発現された84ペプチドが隔離によって同定されていることがわかりました。驚くべきことに、Q-fishとSequestの両方で発見されたこれら22個のペプチドのうち、13個のペプチドはヒト肝臓癌で知られており、残りの9個のペプチドは他の癌に関連することが知られています。 結論:タンパク質種を正確に識別し、質量分析データから同定されたペプチドの発現レベルを同時に定量化するための新しい統計的方法Q-fishを提案しました。ヒトHCCおよび肝臓組織サンプルに関するQフィッシュ分析により、HCCに非常に関連する多くのタンパク質バイオマーカーが特定されました。Q-Fishは、質量分析データ分析のペプチド同定と定量化の両方に役立つツールになります。また、隔離や他の標準的な方法よりも、新しいタンパク質バイオマーカーを発見するのに効果的であることが証明される場合があります。

背景:質量分析(MS)によるタンパク質発現の定量化は、さまざまなプロテオミクス研究で導入されています。特に、スペクトルカウントやスペクトル特徴分析などの2つのラベルフリーの定量化方法が、さまざまなプロテオーム研究で広く調査されています。両方の方法の基礎は、プロテオームデータベース検索とその後のペプチド保持時間の推定に基づくペプチド同定です。しかし、彼らはしばしば制限的なデータベース検索と液体クロマトグラフィー(LC)保持時間の不正確な推定に悩まされます。さらに、SecestやSpectrastなどのスペクトルライブラリ検索アルゴリズムに基づいた従来のペプチド識別方法は、最高の一致も高得点も高い一致も提供していないことがわかっています。最後に、これらの方法は、標的ペプチドが以前に生成され、データベースまたはスペクトルライブラリに保存されない限り識別できないという意味で制限されています。これらの制限を克服するために、Tandem Spectam spectraの存在を推定するための均一なペプチド(Q-fish)の同一のスペクトルセット(Q-fish)の同一のスペクトルセットを見つけることに基づいた新しい方法を提案します。直感的には、Q-fishメソッドは、既知のタンパク質と新規タンパク質の両方を識別するために、実験スペクトルのすべての可能なペアを比較し、同じペプチドターゲットから複製されたスペクトルをグループ化することにより、識別精度を大幅に向上させます。 結果:ヒト肝細胞癌(HCC)および正常な肝臓組織サンプルから得られたNANO-LC-MS/MSデータにQ-fishを適用して、正常サンプルと疾患サンプルの間で差次的に発現するペプチドを特定しました。MS/MS分析を通じて得られた合計44,318スペクトルの場合、Q-Fishは14,747個のクラスターを生成しました。これらのうち、5,777個のクラスターがHCCサンプルでのみ識別され、通常の組織サンプルでのみ6,648個のクラスターが、HCCおよび正常組織サンプルの両方で2,323個のクラスターが特定されました。1つのサンプルからのみ見られるペプチドクラスターを調査することは興味深いでしょうが、HCCと正常サンプルの両方で同定されたスペクトルクラスターをさらに調べてください。目標は定量的に異なる発現ペプチドを特定して評価することです。次のステップは、HCCと正常な組織サンプルの間に差次的に発現したペプチドを分離するためのベータ双項テストを実行することでした。このテストにより、HCCと正常組織サンプルの間に大幅に異なるスペクトル数がある84個のペプチドが生じました。隔離により50と95のペプチドを独立して特定しましたが、そのうち24ペプチドと56個のペプチドは、ヒト肝臓がんのバイオマーカーが知られていることがわかりました。Q-fishとSequestの結果を比較すると、Q-fishによって22の差次的に発現された84ペプチドが隔離によって同定されていることがわかりました。驚くべきことに、Q-fishとSequestの両方で発見されたこれら22個のペプチドのうち、13個のペプチドはヒト肝臓癌で知られており、残りの9個のペプチドは他の癌に関連することが知られています。 結論:タンパク質種を正確に識別し、質量分析データから同定されたペプチドの発現レベルを同時に定量化するための新しい統計的方法Q-fishを提案しました。ヒトHCCおよび肝臓組織サンプルに関するQフィッシュ分析により、HCCに非常に関連する多くのタンパク質バイオマーカーが特定されました。Q-Fishは、質量分析データ分析のペプチド同定と定量化の両方に役立つツールになります。また、隔離や他の標準的な方法よりも、新しいタンパク質バイオマーカーを発見するのに効果的であることが証明される場合があります。

BACKGROUND: Quantification of protein expression by means of mass spectrometry (MS) has been introduced in various proteomics studies. In particular, two label-free quantification methods, such as spectral counting and spectra feature analysis have been extensively investigated in a wide variety of proteomic studies. The cornerstone of both methods is peptide identification based on a proteomic database search and subsequent estimation of peptide retention time. However, they often suffer from restrictive database search and inaccurate estimation of the liquid chromatography (LC) retention time. Furthermore, conventional peptide identification methods based on the spectral library search algorithms such as SEQUEST or SpectraST have been found to provide neither the best match nor high-scored matches. Lastly, these methods are limited in the sense that target peptides cannot be identified unless they have been previously generated and stored into the database or spectral libraries.To overcome these limitations, we propose a novel method, namely Quantification method based on Finding the Identical Spectral set for a Homogenous peptide (Q-FISH) to estimate the peptide's abundance from its tandem mass spectrometry (MS/MS) spectra through the direct comparison of experimental spectra. Intuitively, our Q-FISH method compares all possible pairs of experimental spectra in order to identify both known and novel proteins, significantly enhancing identification accuracy by grouping replicated spectra from the same peptide targets. RESULTS: We applied Q-FISH to Nano-LC-MS/MS data obtained from human hepatocellular carcinoma (HCC) and normal liver tissue samples to identify differentially expressed peptides between the normal and disease samples. For a total of 44,318 spectra obtained through MS/MS analysis, Q-FISH yielded 14,747 clusters. Among these, 5,777 clusters were identified only in the HCC sample, 6,648 clusters only in the normal tissue sample, and 2,323 clusters both in the HCC and normal tissue samples. While it will be interesting to investigate peptide clusters only found from one sample, further examined spectral clusters identified both in the HCC and normal samples since our goal is to identify and assess differentially expressed peptides quantitatively. The next step was to perform a beta-binomial test to isolate differentially expressed peptides between the HCC and normal tissue samples. This test resulted in 84 peptides with significantly differential spectral counts between the HCC and normal tissue samples. We independently identified 50 and 95 peptides by SEQUEST, of which 24 and 56 peptides, respectively, were found to be known biomarkers for the human liver cancer. Comparing Q-FISH and SEQUEST results, we found 22 of the differentially expressed 84 peptides by Q-FISH were also identified by SEQUEST. Remarkably, of these 22 peptides discovered both by Q-FISH and SEQUEST, 13 peptides are known for human liver cancer and the remaining 9 peptides are known to be associated with other cancers. CONCLUSIONS: We proposed a novel statistical method, Q-FISH, for accurately identifying protein species and simultaneously quantifying the expression levels of identified peptides from mass spectrometry data. Q-FISH analysis on human HCC and liver tissue samples identified many protein biomarkers that are highly relevant to HCC. Q-FISH can be a useful tool both for peptide identification and quantification on mass spectrometry data analysis. It may also prove to be more effective in discovering novel protein biomarkers than SEQUEST and other standard methods.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google