Loading...
Journal of chemical theory and computation2019Dec10Vol.15issue(12)

Monte-Carloおよび進化的アルゴリズムを使用したReaxffパラメーター最適化:ガイドラインと洞察

,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

Reaxffは、関心のある化学のために信頼性の高いフォースフィールドパラメーターが利用可能である場合、多様な化学物質を持つ拡張分子モデルの複雑な反応性ダイナミクスをシミュレートするための計算効率的な力場です。そうでない場合は、関連するトレーニングセットでReaxffが作成するエラーを最小限に抑えることで最適化する必要があります。この最適化は些細なものとはほど遠いため、多くの方法、特に遺伝的アルゴリズム(GAS)が開発されており、パラメーター空間でグローバルな最適を検索しています。最近、2つの代替パラメーターキャリブレーション手法、つまりMonte-Carlo Force Field Optimizer(MCFF)と共分散行列適応進化戦略(CMA-ES)が提案されました。この作業では、CMA-ES、MCFF、およびGAメソッド(OGOLEM)は、文献の3つのトレーニングセットを使用して体系的に比較されます。異なるランダムシードと初期パラメーター推測で最適化を繰り返すことにより、これらの方法のいずれかで単一の最適化を実行することは盲目的に信頼されるべきではないことが示されています。GAは、局所的な最小値に閉じ込められるリスクが最も少ないことを示していますが、CMA-ESは、体系的ではありませんが、ケースの3分の2の最低エラーに到達することができます。各方法について、合理的なデフォルト設定を提供し、分析は将来の作業での使用に関する有用なガイドラインを提供します。重要な副作用パラメーターの最適化を障害することは数値ノイズです。詳細な分析では、たとえば、トレーニングセットでのみの明確なジオメトリの最適化を使用することにより、それを減らすことができることが明らかになりました。このノイズがなくても、多くの明確なほぼ最適なパラメーターベクトルを見つけることができ、トレーニングセットを改善し、過剰フィットアーティファクトを検出するための新しい道が開きます。

Reaxffは、関心のある化学のために信頼性の高いフォースフィールドパラメーターが利用可能である場合、多様な化学物質を持つ拡張分子モデルの複雑な反応性ダイナミクスをシミュレートするための計算効率的な力場です。そうでない場合は、関連するトレーニングセットでReaxffが作成するエラーを最小限に抑えることで最適化する必要があります。この最適化は些細なものとはほど遠いため、多くの方法、特に遺伝的アルゴリズム(GAS)が開発されており、パラメーター空間でグローバルな最適を検索しています。最近、2つの代替パラメーターキャリブレーション手法、つまりMonte-Carlo Force Field Optimizer(MCFF)と共分散行列適応進化戦略(CMA-ES)が提案されました。この作業では、CMA-ES、MCFF、およびGAメソッド(OGOLEM)は、文献の3つのトレーニングセットを使用して体系的に比較されます。異なるランダムシードと初期パラメーター推測で最適化を繰り返すことにより、これらの方法のいずれかで単一の最適化を実行することは盲目的に信頼されるべきではないことが示されています。GAは、局所的な最小値に閉じ込められるリスクが最も少ないことを示していますが、CMA-ESは、体系的ではありませんが、ケースの3分の2の最低エラーに到達することができます。各方法について、合理的なデフォルト設定を提供し、分析は将来の作業での使用に関する有用なガイドラインを提供します。重要な副作用パラメーターの最適化を障害することは数値ノイズです。詳細な分析では、たとえば、トレーニングセットでのみの明確なジオメトリの最適化を使用することにより、それを減らすことができることが明らかになりました。このノイズがなくても、多くの明確なほぼ最適なパラメーターベクトルを見つけることができ、トレーニングセットを改善し、過剰フィットアーティファクトを検出するための新しい道が開きます。

ReaxFF is a computationally efficient force field to simulate complex reactive dynamics in extended molecular models with diverse chemistries, if reliable force-field parameters are available for the chemistry of interest. If not, they must be optimized by minimizing the error ReaxFF makes on a relevant training set. Because this optimization is far from trivial, many methods, in particular, genetic algorithms (GAs), have been developed to search for the global optimum in parameter space. Recently, two alternative parameter calibration techniques were proposed, that is, Monte-Carlo force field optimizer (MCFF) and covariance matrix adaptation evolutionary strategy (CMA-ES). In this work, CMA-ES, MCFF, and a GA method (OGOLEM) are systematically compared using three training sets from the literature. By repeating optimizations with different random seeds and initial parameter guesses, it is shown that a single optimization run with any of these methods should not be trusted blindly: nonreproducible, poor or premature convergence is a common deficiency. GA shows the smallest risk of getting trapped into a local minimum, whereas CMA-ES is capable of reaching the lowest errors for two-third of the cases, although not systematically. For each method, we provide reasonable default settings, and our analysis offers useful guidelines for their usage in future work. An important side effect impairing parameter optimization is numerical noise. A detailed analysis reveals that it can be reduced, for example, by using exclusively unambiguous geometry optimization in the training set. Even without this noise, many distinct near-optimal parameter vectors can be found, which opens new avenues for improving the training set and detecting overfitting artifacts.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google