著名医師による解説が無料で読めます
すると翻訳の精度が向上します
過去10年間で、深い学習の使用は、医療画像診断分野で広く増加しています。ディープラーニングベースの方法 '(DLMS)パフォーマンスは、トレーニングデータに強く依存しています。したがって、研究者はしばしば、さまざまな医療施設からできるだけ多くのデータを収集したり、カテゴリ間の不均衡(ICI)の影響を回避するためのアプローチを開発したりすることに焦点を当てます。これは、カテゴリ間のデータ量の違いを意味します。ただし、各医療施設内のICIにより、医療データは多くの場合、医療施設間で異なる環境で分離および獲得され、ソース内の不均衡(ISI)特性の問題として知られています。この不均衡は、DLMSのパフォーマンスにも影響を与えますが、無視できる注目を集めます。この研究では、DLMSに対するISIの影響を研究しています。これは、ソース内の不均衡な胸部X線(CXR)データセットとソース内バランスCXRデータセットによって個別にトレーニングされたディープラーニングモデルのバージョンと比較して研究しています。Covid-19診断。発見は、ソース内の不均衡なデータセットを使用すると、深刻なトレーニングバイアスが生じることですが、データセットにはカテゴリ間のバランスが良好です。対照的に、ディープラーニングモデルは、ソース内バランスデータセットで訓練されたときに信頼できる診断を行いました。したがって、我々の研究は、DLMSのパフォーマンスの低さのリスクを最小限に抑えるために、トレーニングデータにとってソース内バランスが不可欠であるという明確な証拠を報告しています。
過去10年間で、深い学習の使用は、医療画像診断分野で広く増加しています。ディープラーニングベースの方法 '(DLMS)パフォーマンスは、トレーニングデータに強く依存しています。したがって、研究者はしばしば、さまざまな医療施設からできるだけ多くのデータを収集したり、カテゴリ間の不均衡(ICI)の影響を回避するためのアプローチを開発したりすることに焦点を当てます。これは、カテゴリ間のデータ量の違いを意味します。ただし、各医療施設内のICIにより、医療データは多くの場合、医療施設間で異なる環境で分離および獲得され、ソース内の不均衡(ISI)特性の問題として知られています。この不均衡は、DLMSのパフォーマンスにも影響を与えますが、無視できる注目を集めます。この研究では、DLMSに対するISIの影響を研究しています。これは、ソース内の不均衡な胸部X線(CXR)データセットとソース内バランスCXRデータセットによって個別にトレーニングされたディープラーニングモデルのバージョンと比較して研究しています。Covid-19診断。発見は、ソース内の不均衡なデータセットを使用すると、深刻なトレーニングバイアスが生じることですが、データセットにはカテゴリ間のバランスが良好です。対照的に、ディープラーニングモデルは、ソース内バランスデータセットで訓練されたときに信頼できる診断を行いました。したがって、我々の研究は、DLMSのパフォーマンスの低さのリスクを最小限に抑えるために、トレーニングデータにとってソース内バランスが不可欠であるという明確な証拠を報告しています。
Over the past decade, the use of deep learning has been widely increasing in the medical image diagnosis field. Deep learning-based methods' (DLMs) performance strongly relies on training data. Therefore, researchers often focus on collecting as much data as possible from different medical facilities or developing approaches to avoid the impact of inter-category imbalance (ICI), which means a difference in data quantity among categories. However, due to the ICI within each medical facility, medical data are often isolated and acquired in different settings among medical facilities, known as the issue of intra-source imbalance (ISI) characteristic. This imbalance also impacts the performance of DLMs but receives negligible attention. In this study, we study the impact of the ISI on DLMs by comparison of the version of a deep learning model that was trained separately by an intra-source imbalanced chest X-ray (CXR) dataset and an intra-source balanced CXR dataset for COVID-19 diagnosis. The finding is that using the intra-source imbalanced dataset causes a serious training bias, although the dataset has a good inter-category balance. In contrast, the deep learning model performed a reliable diagnosis when trained on the intra-source balanced dataset. Therefore, our study reports clear evidence that the intra-source balance is vital for training data to minimize the risk of poor performance of DLMs.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。