Loading...
※翻訳は機械翻訳サービスを利用しております
Diagnostics (Basel, Switzerland)2023Feb07Vol.13issue(4)

全身性妊娠中の女性の有害な妊娠転帰を予測するための機械学習モデル

,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

副次的な結果を予測することは、リスクを最小限に抑えるために、全身性エリテマトーデス(SLE)の妊婦にとって不可欠です。統計分析の適用は、出産患者の小さなサンプルサイズでは限られている場合がありますが、有益な医療記録を提供できます。この研究は、より多くの情報を探求するために、機械学習(ML)技術を適用する予測モデルを開発することを目的としています。288の変数を含むSLEを示す51人の妊婦の回顧的分析を実施しました。相関分析と特徴選択の後、6つのMLモデルがフィルター処理されたデータセットに適用されました。これらの全体的なモデルの効率は、受信機の動作特性曲線によって評価されました。一方、妊娠に基づいて異なるタイムスパンを持つリアルタイムモデルも調査されました。18の変数が2つのグループ間で統計的な違いを示しました。ML変数選択戦略によって、40を超える変数が予測因子の寄与としてスクリーニングされましたが、変数の重複は2つの選択戦略によって証言された影響力のある指標でした。ランダムフォレスト(RF)アルゴリズムは、データが欠けているレートに関係なく、全体的な予測モデルの現在のデータセットの下で最良の識別能力を実証しましたが、マルチレイヤーパーセプトロンモデルは2位にランクされました。一方、RFは、モデルのリアルタイム予測精度を評価する際に最高のパフォーマンスを達成しました。MLモデルは、小さなサンプルサイズの問題が発生した場合に統計的方法の制限を補正することができますが、RF分類器は、そのような構造化された医療記録に適用すると比較的最適に実行されました。

副次的な結果を予測することは、リスクを最小限に抑えるために、全身性エリテマトーデス(SLE)の妊婦にとって不可欠です。統計分析の適用は、出産患者の小さなサンプルサイズでは限られている場合がありますが、有益な医療記録を提供できます。この研究は、より多くの情報を探求するために、機械学習(ML)技術を適用する予測モデルを開発することを目的としています。288の変数を含むSLEを示す51人の妊婦の回顧的分析を実施しました。相関分析と特徴選択の後、6つのMLモデルがフィルター処理されたデータセットに適用されました。これらの全体的なモデルの効率は、受信機の動作特性曲線によって評価されました。一方、妊娠に基づいて異なるタイムスパンを持つリアルタイムモデルも調査されました。18の変数が2つのグループ間で統計的な違いを示しました。ML変数選択戦略によって、40を超える変数が予測因子の寄与としてスクリーニングされましたが、変数の重複は2つの選択戦略によって証言された影響力のある指標でした。ランダムフォレスト(RF)アルゴリズムは、データが欠けているレートに関係なく、全体的な予測モデルの現在のデータセットの下で最良の識別能力を実証しましたが、マルチレイヤーパーセプトロンモデルは2位にランクされました。一方、RFは、モデルのリアルタイム予測精度を評価する際に最高のパフォーマンスを達成しました。MLモデルは、小さなサンプルサイズの問題が発生した場合に統計的方法の制限を補正することができますが、RF分類器は、そのような構造化された医療記録に適用すると比較的最適に実行されました。

Predicting adverse outcomes is essential for pregnant women with systemic lupus erythematosus (SLE) to minimize risks. Applying statistical analysis may be limited for the small sample size of childbearing patients, while the informative medical records could be provided. This study aimed to develop predictive models applying machine learning (ML) techniques to explore more information. We performed a retrospective analysis of 51 pregnant women exhibiting SLE, including 288 variables. After correlation analysis and feature selection, six ML models were applied to the filtered dataset. The efficiency of these overall models was evaluated by the Receiver Operating Characteristic Curve. Meanwhile, real-time models with different timespans based on gestation were also explored. Eighteen variables demonstrated statistical differences between the two groups; more than forty variables were screened out by ML variable selection strategies as contributing predictors, while the overlap of variables were the influential indicators testified by the two selection strategies. The Random Forest (RF) algorithm demonstrated the best discrimination ability under the current dataset for overall predictive models regardless of the data missing rate, while Multi-Layer Perceptron models ranked second. Meanwhile, RF achieved best performance when assessing the real-time predictive accuracy of models. ML models could compensate the limitation of statistical methods when the small sample size problem happens along with numerous variables acquired, while RF classifier performed relatively best when applied to such structured medical records.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google