著名医師による解説が無料で読めます
すると翻訳の精度が向上します
欠損値は、ラベルフリーの定量的プロテオミクスの真の問題です。最近の研究では、代入を行うためのさまざまな統計的方法を調査し、それらを実際のデータセットまたはシミュレートされたデータセットで比較し、プロテオミクスアプリケーションの欠損値の代入法のリストを推奨しました。洞察力がありますが、これらの比較は2つの重要な事実を考慮していません。(i)プロテオミクスデータセットに応じて、欠落メカニズムは異なる性質であり、(ii)各代入法は特定のタイプの欠落メカニズムに充てられています。その結果、問題は、一般的に最も正確な帰属方法を見つけることではなく、最も適切な方法を見つけることであると考えています。私たちの見解をサポートする一連の比較について説明します。たとえば、データ処理パイプラインの「適切な」時間に適用される場合(前に(つまり、ベースラインの平均結果を与える)、おそらく「パフォーマンスの低い」方法(つまり、ベースラインの平均結果が得られる)を示します。または、欠損値の「適切な」性質を持つデータセットのペプチド凝集後、盲目的に適用される、おそらく「より良い」方法(つまり、最先端の参照方法)を上回ることができます。これにより、プロテオミクスのコンテキストでの代入法の選択と適用に関する実用的なガイドラインはほとんどありません。
欠損値は、ラベルフリーの定量的プロテオミクスの真の問題です。最近の研究では、代入を行うためのさまざまな統計的方法を調査し、それらを実際のデータセットまたはシミュレートされたデータセットで比較し、プロテオミクスアプリケーションの欠損値の代入法のリストを推奨しました。洞察力がありますが、これらの比較は2つの重要な事実を考慮していません。(i)プロテオミクスデータセットに応じて、欠落メカニズムは異なる性質であり、(ii)各代入法は特定のタイプの欠落メカニズムに充てられています。その結果、問題は、一般的に最も正確な帰属方法を見つけることではなく、最も適切な方法を見つけることであると考えています。私たちの見解をサポートする一連の比較について説明します。たとえば、データ処理パイプラインの「適切な」時間に適用される場合(前に(つまり、ベースラインの平均結果を与える)、おそらく「パフォーマンスの低い」方法(つまり、ベースラインの平均結果が得られる)を示します。または、欠損値の「適切な」性質を持つデータセットのペプチド凝集後、盲目的に適用される、おそらく「より良い」方法(つまり、最先端の参照方法)を上回ることができます。これにより、プロテオミクスのコンテキストでの代入法の選択と適用に関する実用的なガイドラインはほとんどありません。
Missing values are a genuine issue in label-free quantitative proteomics. Recent works have surveyed the different statistical methods to conduct imputation and have compared them on real or simulated data sets and recommended a list of missing value imputation methods for proteomics application. Although insightful, these comparisons do not account for two important facts: (i) depending on the proteomics data set, the missingness mechanism may be of different natures and (ii) each imputation method is devoted to a specific type of missingness mechanism. As a result, we believe that the question at stake is not to find the most accurate imputation method in general but instead the most appropriate one. We describe a series of comparisons that support our views: For instance, we show that a supposedly "under-performing" method (i.e., giving baseline average results), if applied at the "appropriate" time in the data-processing pipeline (before or after peptide aggregation) on a data set with the "appropriate" nature of missing values, can outperform a blindly applied, supposedly "better-performing" method (i.e., the reference method from the state-of-the-art). This leads us to formulate few practical guidelines regarding the choice and the application of an imputation method in a proteomics context.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。