Loading...
Journal of computer-aided molecular design2019Dec01Vol.33issue(12)

カテプシンの機械学習を使用したフラグメントベースのターゲット固有のランキングプロトコルの調査

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

システインカテプシンプロテアーゼのメンバーであるカテプシンS(CATS)は、関節炎、癌、心血管疾患を含む多くの病理学的プロセスにおける重要な役割により、よく研究されています。猫阻害剤は、ドッキングポーズ予測とアフィニティランキングの両方についてD3R-GC3に含まれており、親和性ランキングの結合のためにD3R-GC4に含まれています。D3Rの猫阻害剤によってもたらされる困難は、主に大きなサイズ、柔軟性の高い、類似の化学構造の3つの側面から来ています。GC4に参加しました。類似性ベースのアライメントドッキングとVinaスコアリングプロトコルを採用する当社の最良の提出モデルは、GC4で459バインダーに対して0.23のKendallのτを生成しました。機械学習のさらなる調査では、CATS固有のトレーニングセットをキュレーションし、類似性ベースの制約ドッキング方法と、大規模な阻害剤を地域に敏感な方法で説明できるアームベースの断片化戦略を採用することにより、最良の構造ベースの断片化戦略を採用します。ランキングプロトコルは、GC4のすべてのバインダーに対して0.52のKendallのτを達成できます。この探索プロセスでは、機械学習を使用した阻害剤ランクプロトコル開発におけるデータ、ドッキングアプローチ、断片化戦略のトレーニングの重要性を実証しました。

システインカテプシンプロテアーゼのメンバーであるカテプシンS(CATS)は、関節炎、癌、心血管疾患を含む多くの病理学的プロセスにおける重要な役割により、よく研究されています。猫阻害剤は、ドッキングポーズ予測とアフィニティランキングの両方についてD3R-GC3に含まれており、親和性ランキングの結合のためにD3R-GC4に含まれています。D3Rの猫阻害剤によってもたらされる困難は、主に大きなサイズ、柔軟性の高い、類似の化学構造の3つの側面から来ています。GC4に参加しました。類似性ベースのアライメントドッキングとVinaスコアリングプロトコルを採用する当社の最良の提出モデルは、GC4で459バインダーに対して0.23のKendallのτを生成しました。機械学習のさらなる調査では、CATS固有のトレーニングセットをキュレーションし、類似性ベースの制約ドッキング方法と、大規模な阻害剤を地域に敏感な方法で説明できるアームベースの断片化戦略を採用することにより、最良の構造ベースの断片化戦略を採用します。ランキングプロトコルは、GC4のすべてのバインダーに対して0.52のKendallのτを達成できます。この探索プロセスでは、機械学習を使用した阻害剤ランクプロトコル開発におけるデータ、ドッキングアプローチ、断片化戦略のトレーニングの重要性を実証しました。

Cathepsin S (CatS), a member of cysteine cathepsin proteases, has been well studied due to its significant role in many pathological processes, including arthritis, cancer and cardiovascular diseases. CatS inhibitors have been included in D3R-GC3 for both docking pose prediction and affinity ranking, and in D3R-GC4 for binding affinity ranking. The difficulties posed by CatS inhibitors in D3R mainly come from three aspects: large size, high flexibility and similar chemical structures. We have participated in GC4; our best submitted model, which employs a similarity-based alignment docking and Vina scoring protocol, yielded Kendall's τ of 0.23 for 459 binders in GC4. In our further explorations with machine learning, by curating a CatS specific training set, adopting a similarity-based constrained docking method as well as an arm-based fragmentation strategy which can describe large inhibitors in a locality-sensitive fashion, our best structure-based ranking protocol can achieve Kendall's τ of 0.52 for all binders in GC4. In this exploration process, we have demonstrated the importance of training data, docking approaches and fragmentation strategies in inhibitor-ranking protocol development with machine learning.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google