著名医師による解説が無料で読めます
すると翻訳の精度が向上します
定量的構造活性関係(QSAR)モデルは、長年にわたって最適化、仮想スクリーニング、および他の創薬分野をリードするために成功裏に適用されてきました。しかし、最近の研究では、予測的であるが、しばしば解釈できないモデルの開発に焦点を当てています。この記事では、予測的および解釈可能なQSARモデルの両方を開発するために、区分的線形回帰アルゴリズムであるOplraregの適用を提案します。アルゴリズムは、データを領域に最適に分離する機能を決定し、線形方程式を識別して各領域の結果変数を予測します。過剰適合の問題を防ぎ、最も有益な機能を暗黙的に選択するために、正則化の用語が導入されます。Oplraregは、最適化の問題のための柔軟で透明な表現である数学プログラミングに基づいているため、アルゴリズムでは、カスタマイズされた制約をモデルに簡単に追加することもできます。提案されたアルゴリズムは、他の一般的に使用される機械学習アルゴリズムのより解釈可能な代替品として提示され、ランダムフォレスト、サポートベクターマシン、およびランダム一般化された線形モデルと、ChemBLデータベースからコンパイルされた5つのQSARデータセットを使用したランダム一般化線形モデルを示しています。
定量的構造活性関係(QSAR)モデルは、長年にわたって最適化、仮想スクリーニング、および他の創薬分野をリードするために成功裏に適用されてきました。しかし、最近の研究では、予測的であるが、しばしば解釈できないモデルの開発に焦点を当てています。この記事では、予測的および解釈可能なQSARモデルの両方を開発するために、区分的線形回帰アルゴリズムであるOplraregの適用を提案します。アルゴリズムは、データを領域に最適に分離する機能を決定し、線形方程式を識別して各領域の結果変数を予測します。過剰適合の問題を防ぎ、最も有益な機能を暗黙的に選択するために、正則化の用語が導入されます。Oplraregは、最適化の問題のための柔軟で透明な表現である数学プログラミングに基づいているため、アルゴリズムでは、カスタマイズされた制約をモデルに簡単に追加することもできます。提案されたアルゴリズムは、他の一般的に使用される機械学習アルゴリズムのより解釈可能な代替品として提示され、ランダムフォレスト、サポートベクターマシン、およびランダム一般化された線形モデルと、ChemBLデータベースからコンパイルされた5つのQSARデータセットを使用したランダム一般化線形モデルを示しています。
Quantitative Structure-Activity Relationship (QSAR) models have been successfully applied to lead optimisation, virtual screening and other areas of drug discovery over the years. Recent studies, however, have focused on the development of models that are predictive but often not interpretable. In this article, we propose the application of a piecewise linear regression algorithm, OPLRAreg, to develop both predictive and interpretable QSAR models. The algorithm determines a feature to best separate the data into regions and identifies linear equations to predict the outcome variable in each region. A regularisation term is introduced to prevent overfitting problems and implicitly selects the most informative features. As OPLRAreg is based on mathematical programming, a flexible and transparent representation for optimisation problems, the algorithm also permits customised constraints to be easily added to the model. The proposed algorithm is presented as a more interpretable alternative to other commonly used machine learning algorithms and has shown comparable predictive accuracy to Random Forest, Support Vector Machine and Random Generalised Linear Model on tests with five QSAR data sets compiled from the ChEMBL database.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。