Loading...
Journal of computer-aided molecular design2000Jan01Vol.14issue(1)

QSAR研究のためのEVA記述子の評価:3予測特性を強化したモデルを検索するための遺伝的アルゴリズムの使用(EVA_GA)

,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

計算された基本分子振動周波数に基づいたEVA構造記述子は、QSARとデータベースの類似性計算の両方の効果的な記述子であることが証明されています。記述子は3D構造に敏感ですが、構造的重ね合わせが必要ないため、フィールドベースの3D-QSARメソッドよりも利点があります。元の手法には、固定標準偏差(SIGMA)の均一なガウス人が線形スケールに投影される周波数を塗りつぶすために使用される標準化方法が含まれます。塗抹関数は、周波数の数と正確な値に関係なく、近位周波数のオーバーラップと、固定寸法記述子の抽出を可能にします。ここでは、異なるスペクトル領域にシグマの最適な局所的な値が存在することが提案されています。つまり、均一なガウスを使用した周波数のオーバーラップは、スペクトルの特定のポイントで、存在する関係を拾うには不十分であるか、騒音によって有意な相関が不明瞭になるような程度に情報を混同することができます。遺伝的アルゴリズムを使用して、最適化されるフィットネススコアとして交差するPLS回帰スコアを使用して、最適な局所的なSigma値を検索します。次に、結果として得られたモデルは、以前に目に見えなかった化合物のテストセットに対して、およびデータスクランブルを通じて検証されました。EVA_GAのパフォーマンスは、EVAおよび類似のCOMFA研究のパフォーマンスと比較されます。後者の場合、特にテストセット予測に関連して、COMFA PLSスコアの安定性に対するグリッド解像度の効果について簡単な評価が作成されています。

計算された基本分子振動周波数に基づいたEVA構造記述子は、QSARとデータベースの類似性計算の両方の効果的な記述子であることが証明されています。記述子は3D構造に敏感ですが、構造的重ね合わせが必要ないため、フィールドベースの3D-QSARメソッドよりも利点があります。元の手法には、固定標準偏差(SIGMA)の均一なガウス人が線形スケールに投影される周波数を塗りつぶすために使用される標準化方法が含まれます。塗抹関数は、周波数の数と正確な値に関係なく、近位周波数のオーバーラップと、固定寸法記述子の抽出を可能にします。ここでは、異なるスペクトル領域にシグマの最適な局所的な値が存在することが提案されています。つまり、均一なガウスを使用した周波数のオーバーラップは、スペクトルの特定のポイントで、存在する関係を拾うには不十分であるか、騒音によって有意な相関が不明瞭になるような程度に情報を混同することができます。遺伝的アルゴリズムを使用して、最適化されるフィットネススコアとして交差するPLS回帰スコアを使用して、最適な局所的なSigma値を検索します。次に、結果として得られたモデルは、以前に目に見えなかった化合物のテストセットに対して、およびデータスクランブルを通じて検証されました。EVA_GAのパフォーマンスは、EVAおよび類似のCOMFA研究のパフォーマンスと比較されます。後者の場合、特にテストセット予測に関連して、COMFA PLSスコアの安定性に対するグリッド解像度の効果について簡単な評価が作成されています。

The EVA structural descriptor, based upon calculated fundamental molecular vibrational frequencies, has proved to be an effective descriptor for both QSAR and database similarity calculations. The descriptor is sensitive to 3D structure but has an advantage over field-based 3D-QSAR methods inasmuch as structural superposition is not required. The original technique involves a standardisation method wherein uniform Gaussians of fixed standard deviation (sigma) are used to smear out frequencies projected onto a linear scale. The smearing function permits the overlap of proximal frequencies and thence the extraction of a fixed dimensional descriptor regardless of the number and precise values of the frequencies. It is proposed here that there exist optimal localised values of sigma in different spectral regions; that is, the overlap of frequencies using uniform Gaussians may, at certain points in the spectrum, either be insufficient to pick up relationships where they exist or mix up information to such an extent that significant correlations are obscured by noise. A genetic algorithm is used to search for optimal localised sigma values using crossvalidated PLS regression scores as the fitness score to be optimised. The resultant models were then validated against a previously unseen test set of compounds and through data scrambling. The performance of EVA_GA is compared to that of EVA and analogous CoMFA studies; in the latter case a brief evaluation is made of the effect of grid resolution upon the stability of CoMFA PLS scores particularly in relation to test set predictions.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google