Loading...
BMC medical informatics and decision making2023Mar22Vol.23issue(1)

Xgboostアルゴリズムに基づいて虚血性脳卒中の中国人患者の入院期間を予測する研究

,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:脳卒中は、家族、国民保健サービス、社会サービス、経済に大きな負担をかけるため、脳卒中の発生率は中国では課題です。入院期間(LOS)は、医療サービスの利用の重要な指標であり、通常、病院管理の効率と患者のケアの質を評価するために使用されます。この研究は、虚血性脳卒中患者のLOSを予測するための機械学習アルゴリズムに基づいた予測モデルを確立しました。 方法:中国の大規模な包括的な病院の電子医療記録から、合計18,195の虚血性脳卒中患者の電子医療記録と28の属性が抽出されました。LOSの予測はマルチ分類問題と見なされ、LOSは1〜7日、8〜14日、14日以上の3つのカテゴリに分けられました。データと機能の選択を前処理した後、Xgboostアルゴリズムを使用して機械学習モデルを構築しました。モデル検証には、10倍の交差検証が使用されました。精度(ACC)、リコール率(RE)、およびF1尺度を使用して、虚血性脳卒中患者のLOSの予測モデルのパフォーマンスを評価しました。最後に、Xgboostアルゴリズムを使用して、機能の重要性に基づいてすべての属性をランク付けすることにより、無関係な機能を識別および削除しました。 結果:ナイーブなベイジアンアルゴリズム、ロジスティック領域アルゴリズム、決定ツリー分類器アルゴリズム、およびADABOOST分類器アルゴリズムと比較して、XGBootアルゴリズムはACC、RE、F1の測定値が高い。平均ACC、RE、およびF1の測定値は、10倍の交差検証で0.89、0.89、および0.89でした。特徴の重要性の分析によれば、虚血性脳卒中患者のLOSは、人口統計学的特性、過去の病歴、入院検査の特徴、および手術特性の影響を受けました。最後に、片麻痺の失語症、MRS、NIHSS、TIA、手術、またはcom睡指数などの特徴は、虚血性脳卒中患者のLOSを予測する上で重要な最高の特徴であることがわかりました。 結論:Xgboostアルゴリズムは、虚血性脳卒中患者のLOSを予測するための適切な機械学習方法でした。予測モデルに基づいて、虚血性脳卒中患者の電子医療記録に基づいてLOSを予測するために、インテリジェントな医療管理予測システムを開発できました。

背景:脳卒中は、家族、国民保健サービス、社会サービス、経済に大きな負担をかけるため、脳卒中の発生率は中国では課題です。入院期間(LOS)は、医療サービスの利用の重要な指標であり、通常、病院管理の効率と患者のケアの質を評価するために使用されます。この研究は、虚血性脳卒中患者のLOSを予測するための機械学習アルゴリズムに基づいた予測モデルを確立しました。 方法:中国の大規模な包括的な病院の電子医療記録から、合計18,195の虚血性脳卒中患者の電子医療記録と28の属性が抽出されました。LOSの予測はマルチ分類問題と見なされ、LOSは1〜7日、8〜14日、14日以上の3つのカテゴリに分けられました。データと機能の選択を前処理した後、Xgboostアルゴリズムを使用して機械学習モデルを構築しました。モデル検証には、10倍の交差検証が使用されました。精度(ACC)、リコール率(RE)、およびF1尺度を使用して、虚血性脳卒中患者のLOSの予測モデルのパフォーマンスを評価しました。最後に、Xgboostアルゴリズムを使用して、機能の重要性に基づいてすべての属性をランク付けすることにより、無関係な機能を識別および削除しました。 結果:ナイーブなベイジアンアルゴリズム、ロジスティック領域アルゴリズム、決定ツリー分類器アルゴリズム、およびADABOOST分類器アルゴリズムと比較して、XGBootアルゴリズムはACC、RE、F1の測定値が高い。平均ACC、RE、およびF1の測定値は、10倍の交差検証で0.89、0.89、および0.89でした。特徴の重要性の分析によれば、虚血性脳卒中患者のLOSは、人口統計学的特性、過去の病歴、入院検査の特徴、および手術特性の影響を受けました。最後に、片麻痺の失語症、MRS、NIHSS、TIA、手術、またはcom睡指数などの特徴は、虚血性脳卒中患者のLOSを予測する上で重要な最高の特徴であることがわかりました。 結論:Xgboostアルゴリズムは、虚血性脳卒中患者のLOSを予測するための適切な機械学習方法でした。予測モデルに基づいて、虚血性脳卒中患者の電子医療記録に基づいてLOSを予測するために、インテリジェントな医療管理予測システムを開発できました。

BACKGROUND: The incidence of stroke is a challenge in China, as stroke imposes a heavy burden on families, national health services, social services, and the economy. The length of hospital stay (LOS) is an essential indicator of utilization of medical services and is usually used to assess the efficiency of hospital management and patient quality of care. This study established a prediction model based on a machine learning algorithm to predict ischemic stroke patients' LOS. METHODS: A total of 18,195 ischemic stroke patients' electronic medical records and 28 attributes were extracted from electronic medical records in a large comprehensive hospital in China. The prediction of LOS was regarded as a multi classification problem, and LOS was divided into three categories: 1-7 days, 8-14 days and more than 14 days. After preprocessing the data and feature selection, the XGBoost algorithm was used to build a machine learning model. Ten fold cross-validation was used for model validation. The accuracy (ACC), recall rate (RE) and F1 measure were used to evaluate the performance of the prediction model of LOS of ischemic stroke patients. Finally, the XGBoost algorithm was used to identify and remove irrelevant features by ranking all attributes based on feature importance. RESULTS: Compared with the naive Bayesian algorithm, logistic region algorithm, decision tree classifier algorithm and ADaBoost classifier algorithm, the XGBoot algorithm has higher ACC, RE and F1 measure. The average ACC, RE and F1 measure were 0.89, 0.89 and 0.89 under the 10-fold cross-validation. According to the analysis of the importance of features, the LOS of ischemic stroke patients was affected by demographic characteristics, past medical history, admission examination features, and operation characteristics. Finally, the features in terms of hemiplegia aphasia, MRS, NIHSS, TIA, Operation or not, coma index etc. were found to be the top features in importance in predicting the LOS of ischemic stroke patients. CONCLUSIONS: The XGBoost algorithm was an appropriate machine learning method for predicting the LOS of patients with ischemic stroke. Based on the prediction model, an intelligent medical management prediction system could be developed to predict the LOS based on ischemic stroke patients' electronic medical records.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google