Loading...
RSC medicinal chemistry2024Jun19Vol.15issue(6)

大規模な言語モデルは、抗菌ペプチドの活性と毒性を予測できますか?

,
,
文献タイプ:
  • Journal Article
概要
Abstract

抗菌性ペプチド(AMP)は、抗菌薬耐性の危機に対処するのに役立つ可能性のある数十のアミノ酸の自然に発生または設計されたペプチドです。しかし、それらの臨床開発は、ヒト細胞に対する毒性によって制限されています。これは、制御が非常に困難なパラメーターです。ペプチド配列と単語の類似性を考えると、大規模な言語モデル(LLM)はAMP活性と毒性を予測できる可能性があります。この仮説をテストするために、抗菌活性のデータベースとペプチドの構造(DBAASP)のデータを使用してLLMを微調整しました。GPT-3はうまく機能しましたが、毒性の代理として採用された活動の予測と溶血については再現できませんでした。後のGPT-3.5はより貧弱に機能し、MAP4C分子指紋アクティブデータでトレーニングされたシーケンス活性データまたはサポートベクターマシン(SVM)でトレーニングされた再発性ニューラルネットワーク(RNN)によって超えられました。したがって、これらのより単純なモデルが推奨されますが、LLMSの急速な進化は予測能力の将来の再評価を保証します。

抗菌性ペプチド(AMP)は、抗菌薬耐性の危機に対処するのに役立つ可能性のある数十のアミノ酸の自然に発生または設計されたペプチドです。しかし、それらの臨床開発は、ヒト細胞に対する毒性によって制限されています。これは、制御が非常に困難なパラメーターです。ペプチド配列と単語の類似性を考えると、大規模な言語モデル(LLM)はAMP活性と毒性を予測できる可能性があります。この仮説をテストするために、抗菌活性のデータベースとペプチドの構造(DBAASP)のデータを使用してLLMを微調整しました。GPT-3はうまく機能しましたが、毒性の代理として採用された活動の予測と溶血については再現できませんでした。後のGPT-3.5はより貧弱に機能し、MAP4C分子指紋アクティブデータでトレーニングされたシーケンス活性データまたはサポートベクターマシン(SVM)でトレーニングされた再発性ニューラルネットワーク(RNN)によって超えられました。したがって、これらのより単純なモデルが推奨されますが、LLMSの急速な進化は予測能力の将来の再評価を保証します。

Antimicrobial peptides (AMPs) are naturally occurring or designed peptides up to a few tens of amino acids which may help address the antimicrobial resistance crisis. However, their clinical development is limited by toxicity to human cells, a parameter which is very difficult to control. Given the similarity between peptide sequences and words, large language models (LLMs) might be able to predict AMP activity and toxicity. To test this hypothesis, we fine-tuned LLMs using data from the Database of Antimicrobial Activity and Structure of Peptides (DBAASP). GPT-3 performed well but not reproducibly for activity prediction and hemolysis, taken as a proxy for toxicity. The later GPT-3.5 performed more poorly and was surpassed by recurrent neural networks (RNN) trained on sequence-activity data or support vector machines (SVM) trained on MAP4C molecular fingerprint-activity data. These simpler models are therefore recommended, although the rapid evolution of LLMs warrants future re-evaluation of their prediction abilities.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google