著名医師による解説が無料で読めます
すると翻訳の精度が向上します
このペーパーでは、入力データ空間を非線形に高次元の特徴空間にマッピングするカーネルラジアル基底関数(RBF)を適用することにより、非線形分離可能な問題に対処するためのカーネルベースのファジークラスタリングアプローチを紹介します。高次元ゲノミクスデータでクラスターを発見することは、ゲノム分析のためのバイオインフォマティクス研究者にとって非常に困難です。バイオインフォマティクスの調査をサポートするために、ゲノムクラスタリングに関する明示的に、単一ヌクレオチド多形(SNP)配列のクラスタリングのためのApache Sparkフレームワークに基づいた高次元カーネルのファジークラスタリングアルゴリズムを提案しました。このペーパーでは、反復最適化ファジーC-means(KSRSIO-FCM)を使用したカーネル化されたスケーラブルなランダムサンプリングを提案します。両方のアプローチは、ローカライズされたサブクラスタリングレジリエント分散データセット(RDD)メソッドにより、Apache Sparkクラスターフレームワークを完全に適応させます。さらに、巨大なSNPシーケンスの数値機能ベクターを生成し、Apache Sparkクラスターで実行することにより、スケーラブルな前処理アプローチにするための前処理アプローチを提案しています。2つの異なる植物種、すなわち大豆と米。提案されているスケーラブルなカーネル化されたファジークラスタリング結果と同様の作品の比較は、時間と空間の複雑さ、シルエットインデックス、およびDavies-Bouldinインデックスに関して提案されたアルゴリズムが大幅に改善されることを示しています。提案されたKSLFCMおよびその他のスケーラブルなクラスタリングアルゴリズム、つまりSRSIO-FCM、およびSLFCMと比較して、提案されたKSRSIO-FCMの有効性を示すために、さまざまなSNPデータセットで徹底的な実験が実行されます。
このペーパーでは、入力データ空間を非線形に高次元の特徴空間にマッピングするカーネルラジアル基底関数(RBF)を適用することにより、非線形分離可能な問題に対処するためのカーネルベースのファジークラスタリングアプローチを紹介します。高次元ゲノミクスデータでクラスターを発見することは、ゲノム分析のためのバイオインフォマティクス研究者にとって非常に困難です。バイオインフォマティクスの調査をサポートするために、ゲノムクラスタリングに関する明示的に、単一ヌクレオチド多形(SNP)配列のクラスタリングのためのApache Sparkフレームワークに基づいた高次元カーネルのファジークラスタリングアルゴリズムを提案しました。このペーパーでは、反復最適化ファジーC-means(KSRSIO-FCM)を使用したカーネル化されたスケーラブルなランダムサンプリングを提案します。両方のアプローチは、ローカライズされたサブクラスタリングレジリエント分散データセット(RDD)メソッドにより、Apache Sparkクラスターフレームワークを完全に適応させます。さらに、巨大なSNPシーケンスの数値機能ベクターを生成し、Apache Sparkクラスターで実行することにより、スケーラブルな前処理アプローチにするための前処理アプローチを提案しています。2つの異なる植物種、すなわち大豆と米。提案されているスケーラブルなカーネル化されたファジークラスタリング結果と同様の作品の比較は、時間と空間の複雑さ、シルエットインデックス、およびDavies-Bouldinインデックスに関して提案されたアルゴリズムが大幅に改善されることを示しています。提案されたKSLFCMおよびその他のスケーラブルなクラスタリングアルゴリズム、つまりSRSIO-FCM、およびSLFCMと比較して、提案されたKSRSIO-FCMの有効性を示すために、さまざまなSNPデータセットで徹底的な実験が実行されます。
This paper introduces a kernel based fuzzy clustering approach to deal with the non-linear separable problems by applying kernel Radial Basis Functions (RBF) which maps the input data space non-linearly into a high-dimensional feature space. Discovering clusters in the high-dimensional genomics data is extremely challenging for the bioinformatics researchers for genome analysis. To support the investigations in bioinformatics, explicitly on genomic clustering, we proposed high-dimensional kernelized fuzzy clustering algorithms based on Apache Spark framework for clustering of Single Nucleotide Polymorphism (SNP) sequences. The paper proposes the Kernelized Scalable Random Sampling with Iterative Optimization Fuzzy c-Means (KSRSIO-FCM) which inherently uses another proposed Kernelized Scalable Literal Fuzzy c-Means (KSLFCM) clustering algorithm. Both the approaches completely adapt the Apache Spark cluster framework by localized sub-clustering Resilient Distributed Dataset (RDD) method. Additionally, we are also proposing a preprocessing approach for generating numeric feature vectors for huge SNP sequences and making it a scalable preprocessing approach by executing it on an Apache Spark cluster, which is applied to real-world SNP datasets taken from open-internet repositories of two different plant species, i.e., soybean and rice. The comparison of the proposed scalable kernelized fuzzy clustering results with similar works shows the significant improvement of the proposed algorithm in terms of time and space complexity, Silhouette index, and Davies-Bouldin index. Exhaustive experiments are performed on various SNP datasets to show the effectiveness of proposed KSRSIO-FCM in comparison with proposed KSLFCM and other scalable clustering algorithms, i.e., SRSIO-FCM, and SLFCM.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。