著名医師による解説が無料で読めます
すると翻訳の精度が向上します
データセットは、深い学習モデル開発の基礎であり、ディープラーニングモデルの成功は、データセットの品質とサイズに大きく依存しています。この作業では、新しいデータ準備プロトコルを提示し、最適化された3D形状で構成される大きなフラグメントベースのデータセットfrag20を構築します。H、B、C、O、N、F、P、S、Cl、およびBRで構成される50万を超える分子の理論新しいデータセットに基づいて、DFT最適化とMMFF最適化された形状の両方の単純化されたPhysNetアーキテクチャを使用して、複数のテストセットで化学精度(1 kcal/mol)よりも優れているか、または近い(1 kcal/mol)を使用して、堅牢な分子エネルギー予測モデルを開発します。実験的な結晶構造に基づくCSD20およびPlati20。
データセットは、深い学習モデル開発の基礎であり、ディープラーニングモデルの成功は、データセットの品質とサイズに大きく依存しています。この作業では、新しいデータ準備プロトコルを提示し、最適化された3D形状で構成される大きなフラグメントベースのデータセットfrag20を構築します。H、B、C、O、N、F、P、S、Cl、およびBRで構成される50万を超える分子の理論新しいデータセットに基づいて、DFT最適化とMMFF最適化された形状の両方の単純化されたPhysNetアーキテクチャを使用して、複数のテストセットで化学精度(1 kcal/mol)よりも優れているか、または近い(1 kcal/mol)を使用して、堅牢な分子エネルギー予測モデルを開発します。実験的な結晶構造に基づくCSD20およびPlati20。
A dataset is the basis of deep learning model development, and the success of deep learning models heavily relies on the quality and size of the dataset. In this work, we present a new data preparation protocol and build a large fragment-based dataset Frag20, which consists of optimized 3D geometries and calculated molecular properties from Merck molecular force field (MMFF) and DFT at the B3LYP/6-31G* level of theory for more than half a million molecules composed of H, B, C, O, N, F, P, S, Cl, and Br with no larger than 20 heavy atoms. Based on the new dataset, we develop robust molecular energy prediction models using a simplified PhysNet architecture for both DFT-optimized and MMFF-optimized geometries, which achieve better than or close to chemical accuracy (1 kcal/mol) on multiple test sets, including CSD20 and Plati20 based on experimental crystal structures.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。