著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:クラスタリングデータセットで欠損値が発生した場合、混合モデルに対処することは困難です。 方法と結果:「擬似完全」データセットを生成するために欠損値を効率的に挿入する多変量ガウス混合モデルに基づいた動的クラスタリングアルゴリズムを提案します。異なるクラスターと欠損値からのパラメーターは、期待最大化アルゴリズムで実装された最尤に応じて推定され、多変量個体はベイジアン後部確率でクラスター化されます。シミュレーションでは、提案された方法の収束速度が高速であり、欠損値を正確に推定することが示されました。提案されたアルゴリズムは、FisherのIRISデータセット、酵母細胞サイクル遺伝子発現データセット、およびCIFAR-10画像データセットでさらに検証されました。結果は、当社のアルゴリズムが、欠損値のない完全なデータセットを使用してそれに匹敵する非常に正確なクラスタリングを提供することを示しています。さらに、私たちのアルゴリズムは、欠落データが削除され、平均置換による欠落価値のある代入を備えた両方のクラスタリングアルゴリズムよりも低い誤判断率をもたらしました。 結論:欠落の価値のある代入クラスタリングアルゴリズムが、特定の状況でこれらの他のクラスタリングアルゴリズムの両方よりも実現可能であり、優れていることを示します。
背景:クラスタリングデータセットで欠損値が発生した場合、混合モデルに対処することは困難です。 方法と結果:「擬似完全」データセットを生成するために欠損値を効率的に挿入する多変量ガウス混合モデルに基づいた動的クラスタリングアルゴリズムを提案します。異なるクラスターと欠損値からのパラメーターは、期待最大化アルゴリズムで実装された最尤に応じて推定され、多変量個体はベイジアン後部確率でクラスター化されます。シミュレーションでは、提案された方法の収束速度が高速であり、欠損値を正確に推定することが示されました。提案されたアルゴリズムは、FisherのIRISデータセット、酵母細胞サイクル遺伝子発現データセット、およびCIFAR-10画像データセットでさらに検証されました。結果は、当社のアルゴリズムが、欠損値のない完全なデータセットを使用してそれに匹敵する非常に正確なクラスタリングを提供することを示しています。さらに、私たちのアルゴリズムは、欠落データが削除され、平均置換による欠落価値のある代入を備えた両方のクラスタリングアルゴリズムよりも低い誤判断率をもたらしました。 結論:欠落の価値のある代入クラスタリングアルゴリズムが、特定の状況でこれらの他のクラスタリングアルゴリズムの両方よりも実現可能であり、優れていることを示します。
BACKGROUND: It is challenging to deal with mixture models when missing values occur in clustering datasets. METHODS AND RESULTS: We propose a dynamic clustering algorithm based on a multivariate Gaussian mixture model that efficiently imputes missing values to generate a "pseudo-complete" dataset. Parameters from different clusters and missing values are estimated according to the maximum likelihood implemented with an expectation-maximization algorithm, and multivariate individuals are clustered with Bayesian posterior probability. A simulation showed that our proposed method has a fast convergence speed and it accurately estimates missing values. Our proposed algorithm was further validated with Fisher's Iris dataset, the Yeast Cell-cycle Gene-expression dataset, and the CIFAR-10 images dataset. The results indicate that our algorithm offers highly accurate clustering, comparable to that using a complete dataset without missing values. Furthermore, our algorithm resulted in a lower misjudgment rate than both clustering algorithms with missing data deleted and with missing-value imputation by mean replacement. CONCLUSION: We demonstrate that our missing-value imputation clustering algorithm is feasible and superior to both of these other clustering algorithms in certain situations.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。