Loading...
IEEE transactions on image processing : a publication of the IEEE Signal Processing Society20000101Vol.9issue(9)

ローカルに適応的な知覚画像コーディング

,
,
文献タイプ:
  • Journal Article
概要
Abstract

画像とビデオの圧縮における既存の取り組みのほとんどは、知覚ではなく、数学的に扱いやすく、測定しやすく、歪みメトリックを最小限に抑えるための方法の開発に焦点を当てています。非知覚歪み測定は、より高いビットレート(高品質のアプリケーション)に対して合理的に信頼性が高いことがわかりましたが、ビットレートの低い品質とはよく相関せず、再構築された画像の重要な知覚品質の保存を保証できません。良好な信号対雑音比(SNR)の可能性。このペーパーでは、知覚ベースの画像コーダーを紹介します。これは、品質とビットレートの点でパフォーマンスの向上を達成するための知覚的関連性に基づいて画像コンポーネントを区別します。新しいコーダーは、視覚データを圧縮するためのローカルに適応的な知覚量子化スキームに基づいています。私たちの戦略は、サブバンド分解に基づいて視覚的なマスキングのしきい値を局所的に適応する方法で導き出すことにより、人間の視覚マスキング特性を活用することです。派生したマスキングしきい値は、各サブバンド変換係数のレベルで存在する局所量のマスキングに量子化再構成レベルを適応させることにより、量子化段階の制御に使用されます。既存の非局所的に適応的な知覚量子化方法と比較して、新しいローカル適応アルゴリズムは優れたパフォーマンスを示し、追加の副情報は必要ありません。これは、すでに量子化されたデータから利用可能なマスキングの量を推定し、検討中の係数の線形予測を推定することで実現されます。地元の適応により、提案された量子化スキームは、大量の知覚的に冗長な情報を削除することができます。アルゴリズムは追加の副情報を必要としないため、画像のエントロピー表現が低くなり、知覚的にロスレスのない画像圧縮に適しています。

画像とビデオの圧縮における既存の取り組みのほとんどは、知覚ではなく、数学的に扱いやすく、測定しやすく、歪みメトリックを最小限に抑えるための方法の開発に焦点を当てています。非知覚歪み測定は、より高いビットレート(高品質のアプリケーション)に対して合理的に信頼性が高いことがわかりましたが、ビットレートの低い品質とはよく相関せず、再構築された画像の重要な知覚品質の保存を保証できません。良好な信号対雑音比(SNR)の可能性。このペーパーでは、知覚ベースの画像コーダーを紹介します。これは、品質とビットレートの点でパフォーマンスの向上を達成するための知覚的関連性に基づいて画像コンポーネントを区別します。新しいコーダーは、視覚データを圧縮するためのローカルに適応的な知覚量子化スキームに基づいています。私たちの戦略は、サブバンド分解に基づいて視覚的なマスキングのしきい値を局所的に適応する方法で導き出すことにより、人間の視覚マスキング特性を活用することです。派生したマスキングしきい値は、各サブバンド変換係数のレベルで存在する局所量のマスキングに量子化再構成レベルを適応させることにより、量子化段階の制御に使用されます。既存の非局所的に適応的な知覚量子化方法と比較して、新しいローカル適応アルゴリズムは優れたパフォーマンスを示し、追加の副情報は必要ありません。これは、すでに量子化されたデータから利用可能なマスキングの量を推定し、検討中の係数の線形予測を推定することで実現されます。地元の適応により、提案された量子化スキームは、大量の知覚的に冗長な情報を削除することができます。アルゴリズムは追加の副情報を必要としないため、画像のエントロピー表現が低くなり、知覚的にロスレスのない画像圧縮に適しています。

Most existing efforts in image and video compression have focused on developing methods to minimize not perceptual but rather mathematically tractable, easy to measure, distortion metrics. While nonperceptual distortion measures were found to be reasonably reliable for higher bit rates (high-quality applications), they do not correlate well with the perceived quality at lower bit rates and they fail to guarantee preservation of important perceptual qualities in the reconstructed images despite the potential for a good signal-to-noise ratio (SNR). This paper presents a perceptual-based image coder, which discriminates between image components based on their perceptual relevance for achieving increased performance in terms of quality and bit rate. The new coder is based on a locally adaptive perceptual quantization scheme for compressing the visual data. Our strategy is to exploit human visual masking properties by deriving visual masking thresholds in a locally adaptive fashion based on a subband decomposition. The derived masking thresholds are used in controlling the quantization stage by adapting the quantizer reconstruction levels to the local amount of masking present at the level of each subband transform coefficient. Compared to the existing non-locally adaptive perceptual quantization methods, the new locally adaptive algorithm exhibits superior performance and does not require additional side information. This is accomplished by estimating the amount of available masking from the already quantized data and linear prediction of the coefficient under consideration. By virtue of the local adaptation, the proposed quantization scheme is able to remove a large amount of perceptually redundant information. Since the algorithm does not require additional side information, it yields a low entropy representation of the image and is well suited for perceptually lossless image compression.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google