Loading...
Conference on Computer Vision and Pattern Recognition Workshops. IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Workshops2021Jun01Vol.2021issue()

スライド全体の画像分類のためのデュアルストリームマルチインスタンス学習ネットワーク自己教師の対照学習

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

全体のスライド画像(WSI)分類の挑戦的な問題に対処します。WSIには非常に高い解像度があり、通常は局所的な注釈がありません。WSI分類は、スライドレベルのラベルのみが利用可能な場合、複数のインスタンス学習(MIL)問題としてキャストできます。局所的な注釈を必要としないWSI分類と腫瘍検出のためのMILベースの方法を提案します。私たちの方法には3つの主要なコンポーネントがあります。まず、デュアルストリームアーキテクチャのインスタンスの関係をトレーニング可能な距離測定でモデル化する新しいMILアグリゲーターを紹介します。第二に、WSIはMILモデルのトレーニングを妨げる大きなまたはバランスの取れたバッグを生産できるため、MILの適切な表現を抽出し、大きなバッグの禁止メモリコストの問題を緩和するために、自己監視の対照学習を使用することを提案します。第三に、マルチスケールWSI機能にピラミッド融合融合メカニズムを採用し、分類とローカリゼーションの精度をさらに向上させます。私たちのモデルは、2つの代表的なWSIデータセットで評価されます。モデルの分類精度は、完全に監視された方法と比較して、データセット全体で2%未満の精度ギャップがあります。また、私たちの結果は、以前のすべてのMILベースの方法よりも優れています。標準のMILデータセットの追加のベンチマーク結果は、一般的なMIL問題に関するMILアグリゲーターの優れた性能をさらに示しています。

全体のスライド画像(WSI)分類の挑戦的な問題に対処します。WSIには非常に高い解像度があり、通常は局所的な注釈がありません。WSI分類は、スライドレベルのラベルのみが利用可能な場合、複数のインスタンス学習(MIL)問題としてキャストできます。局所的な注釈を必要としないWSI分類と腫瘍検出のためのMILベースの方法を提案します。私たちの方法には3つの主要なコンポーネントがあります。まず、デュアルストリームアーキテクチャのインスタンスの関係をトレーニング可能な距離測定でモデル化する新しいMILアグリゲーターを紹介します。第二に、WSIはMILモデルのトレーニングを妨げる大きなまたはバランスの取れたバッグを生産できるため、MILの適切な表現を抽出し、大きなバッグの禁止メモリコストの問題を緩和するために、自己監視の対照学習を使用することを提案します。第三に、マルチスケールWSI機能にピラミッド融合融合メカニズムを採用し、分類とローカリゼーションの精度をさらに向上させます。私たちのモデルは、2つの代表的なWSIデータセットで評価されます。モデルの分類精度は、完全に監視された方法と比較して、データセット全体で2%未満の精度ギャップがあります。また、私たちの結果は、以前のすべてのMILベースの方法よりも優れています。標準のMILデータセットの追加のベンチマーク結果は、一般的なMIL問題に関するMILアグリゲーターの優れた性能をさらに示しています。

We address the challenging problem of whole slide image (WSI) classification. WSIs have very high resolutions and usually lack localized annotations. WSI classification can be cast as a multiple instance learning (MIL) problem when only slide-level labels are available. We propose a MIL-based method for WSI classification and tumor detection that does not require localized annotations. Our method has three major components. First, we introduce a novel MIL aggregator that models the relations of the instances in a dual-stream architecture with trainable distance measurement. Second, since WSIs can produce large or unbalanced bags that hinder the training of MIL models, we propose to use self-supervised contrastive learning to extract good representations for MIL and alleviate the issue of prohibitive memory cost for large bags. Third, we adopt a pyramidal fusion mechanism for multiscale WSI features, and further improve the accuracy of classification and localization. Our model is evaluated on two representative WSI datasets. The classification accuracy of our model compares favorably to fully-supervised methods, with less than 2% accuracy gap across datasets. Our results also outperform all previous MIL-based methods. Additional benchmark results on standard MIL datasets further demonstrate the superior performance of our MIL aggregator on general MIL problems.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google