著名医師による解説が無料で読めます
すると翻訳の精度が向上します
ボコーダーシミュレーションの研究では、採用されたキャリア信号タイプがボコードされた音声の明瞭度に影響することを示唆しています。現在の研究では、キャリア信号のタイプが追加の信号処理、すなわち、ボコーダーシミュレーションの明瞭度を決定する際に、シングルチャネルノイズ抑制とエンベロープダイナミックレンジ圧縮とどのように相互作用するかをさらに評価しました。実験1では、音声スペクトル型ノイズ(SSN)またはツートーカーのせせらぎ(2TB)によって破損していたマンダリンの文は、トーンボコード(TV)またはノイズボーコード(NV)処理を受ける前に、4つのシングルチャネルノイズ抑制アルゴリズムの1つによって処理されました。実験2では、マルチバンドエンベロープ波形の動的範囲は、テレビまたはNV処理を受ける前に、圧縮係数を使用して平均削除されたエンベロープ波形をスケーリングすることにより圧縮されました。テレビのマンダリンの文章は、ノイズボコードされた文よりも、通常の聴覚(NH)リスナーを使用して、より高い明瞭度スコアをもたらしました。ノイズに抑制されたボコードされた音声の明瞭度の利点は、マスカータイプ(SSN対2TB)に依存していました。NVスピーチは、テレビのスピーチよりもエンベロープダイナミックレンジの圧縮により、より悪影響を受けました。これらの発見は、音声プロセスで採用されたキャリア信号タイプと、信号処理によって引き起こされるエンベロープの歪みの間に相互作用効果が存在することを示唆しています。
ボコーダーシミュレーションの研究では、採用されたキャリア信号タイプがボコードされた音声の明瞭度に影響することを示唆しています。現在の研究では、キャリア信号のタイプが追加の信号処理、すなわち、ボコーダーシミュレーションの明瞭度を決定する際に、シングルチャネルノイズ抑制とエンベロープダイナミックレンジ圧縮とどのように相互作用するかをさらに評価しました。実験1では、音声スペクトル型ノイズ(SSN)またはツートーカーのせせらぎ(2TB)によって破損していたマンダリンの文は、トーンボコード(TV)またはノイズボーコード(NV)処理を受ける前に、4つのシングルチャネルノイズ抑制アルゴリズムの1つによって処理されました。実験2では、マルチバンドエンベロープ波形の動的範囲は、テレビまたはNV処理を受ける前に、圧縮係数を使用して平均削除されたエンベロープ波形をスケーリングすることにより圧縮されました。テレビのマンダリンの文章は、ノイズボコードされた文よりも、通常の聴覚(NH)リスナーを使用して、より高い明瞭度スコアをもたらしました。ノイズに抑制されたボコードされた音声の明瞭度の利点は、マスカータイプ(SSN対2TB)に依存していました。NVスピーチは、テレビのスピーチよりもエンベロープダイナミックレンジの圧縮により、より悪影響を受けました。これらの発見は、音声プロセスで採用されたキャリア信号タイプと、信号処理によって引き起こされるエンベロープの歪みの間に相互作用効果が存在することを示唆しています。
Vocoder simulation studies have suggested that the carrier signal type employed affects the intelligibility of vocoded speech. The present work further assessed how carrier signal type interacts with additional signal processing, namely, single-channel noise suppression and envelope dynamic range compression, in determining the intelligibility of vocoder simulations. In Experiment 1, Mandarin sentences that had been corrupted by speech spectrum-shaped noise (SSN) or two-talker babble (2TB) were processed by one of four single-channel noise-suppression algorithms before undergoing tone-vocoded (TV) or noise-vocoded (NV) processing. In Experiment 2, dynamic ranges of multiband envelope waveforms were compressed by scaling of the mean-removed envelope waveforms with a compression factor before undergoing TV or NV processing. TV Mandarin sentences yielded higher intelligibility scores with normal-hearing (NH) listeners than did noise-vocoded sentences. The intelligibility advantage of noise-suppressed vocoded speech depended on the masker type (SSN vs 2TB). NV speech was more negatively influenced by envelope dynamic range compression than was TV speech. These findings suggest that an interactional effect exists between the carrier signal type employed in the vocoding process and envelope distortion caused by signal processing.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。