Loading...
Genes2020Jul18Vol.11issue(7)

浸透戦術最適化(ITO)アルゴリズムを使用したマイクロアレイ遺伝子発現データの分類

,
,
文献タイプ:
  • Journal Article
概要
Abstract

パラメーターフリーおよびパラメーターベースのアルゴリズムを含む文献では、さまざまな機能選択と分類手法が提案されています。前者は速いですが、局所的な最大値をもたらす可能性がありますが、後者はより高い精度のためにデータセット固有のパラメーター調整を使用します。ただし、精度が高いとモデルの信頼性が高いことを意味するとは限りません。したがって、一般化された最適化は、さらなる研究のための課題です。このホワイトペーパーでは、確率計算の分野でのITõプロセスに基づいてITOアルゴリズムと混同しないように、Warzone Inspeciredの「浸潤戦術」ベースの最適化アルゴリズム(ITO)を紹介します。提案されているITOアルゴリズムは、パラメーターフリーとパラメーターベースの分類子を組み合わせて、高精度の高度解放性(HAHR)バイナリ分類器を生成します。アルゴリズムは、2つのフェーズで結果を生成します。(i)軽量歩兵グループ(LIG)は迅速に収束して非ローカルマキシマを見つけ、同等の結果を生成します(つまり、70〜88%の精度)(ii)フォローアップチーム(FT)は高度なチューニングを使用します。ベースラインのパフォーマンスを向上させます(つまり、75〜99%)。ITO軍のすべての兵士は、独立して選択されたサブセット選択方法、前処理、検証方法と分類器を備えた基本モデルです。成功した兵士は、最適な結果を得るために不均一なアンサンブルを介して組み合わされます。提案されたアプローチは、データ不足の問題に対処し、不均一なベース分類器の選択に柔軟であり、確立されたMAQC-IIの結果に匹敵するHAHRモデルを生成することができます。

パラメーターフリーおよびパラメーターベースのアルゴリズムを含む文献では、さまざまな機能選択と分類手法が提案されています。前者は速いですが、局所的な最大値をもたらす可能性がありますが、後者はより高い精度のためにデータセット固有のパラメーター調整を使用します。ただし、精度が高いとモデルの信頼性が高いことを意味するとは限りません。したがって、一般化された最適化は、さらなる研究のための課題です。このホワイトペーパーでは、確率計算の分野でのITõプロセスに基づいてITOアルゴリズムと混同しないように、Warzone Inspeciredの「浸潤戦術」ベースの最適化アルゴリズム(ITO)を紹介します。提案されているITOアルゴリズムは、パラメーターフリーとパラメーターベースの分類子を組み合わせて、高精度の高度解放性(HAHR)バイナリ分類器を生成します。アルゴリズムは、2つのフェーズで結果を生成します。(i)軽量歩兵グループ(LIG)は迅速に収束して非ローカルマキシマを見つけ、同等の結果を生成します(つまり、70〜88%の精度)(ii)フォローアップチーム(FT)は高度なチューニングを使用します。ベースラインのパフォーマンスを向上させます(つまり、75〜99%)。ITO軍のすべての兵士は、独立して選択されたサブセット選択方法、前処理、検証方法と分類器を備えた基本モデルです。成功した兵士は、最適な結果を得るために不均一なアンサンブルを介して組み合わされます。提案されたアプローチは、データ不足の問題に対処し、不均一なベース分類器の選択に柔軟であり、確立されたMAQC-IIの結果に匹敵するHAHRモデルを生成することができます。

A number of different feature selection and classification techniques have been proposed in literature including parameter-free and parameter-based algorithms. The former are quick but may result in local maxima while the latter use dataset-specific parameter-tuning for higher accuracy. However, higher accuracy may not necessarily mean higher reliability of the model. Thus, generalized optimization is still a challenge open for further research. This paper presents a warzone inspired "infiltration tactics" based optimization algorithm (ITO)-not to be confused with the ITO algorithm based on the Itõ Process in the field of Stochastic calculus. The proposed ITO algorithm combines parameter-free and parameter-based classifiers to produce a high-accuracy-high-reliability (HAHR) binary classifier. The algorithm produces results in two phases: (i) Lightweight Infantry Group (LIG) converges quickly to find non-local maxima and produces comparable results (i.e., 70 to 88% accuracy) (ii) Followup Team (FT) uses advanced tuning to enhance the baseline performance (i.e., 75 to 99%). Every soldier of the ITO army is a base model with its own independently chosen Subset selection method, pre-processing, and validation methods and classifier. The successful soldiers are combined through heterogeneous ensembles for optimal results. The proposed approach addresses a data scarcity problem, is flexible to the choice of heterogeneous base classifiers, and is able to produce HAHR models comparable to the established MAQC-II results.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google