Loading...
JMIR formative research2022Aug05Vol.6issue(8)

職業的ボーカルヘルスモニタリングのためのウェアラブル首の表面加速度計:機器と分析の検証研究

,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景:首の表面加速度計(NSA)ウェアラブルデバイスは、音声および気道の健康監視のために開発されています。音響音とは対照的に、NSAは声帯から首の皮膚に伝播された機械的振動を感知します。これは、人の声と気道の状態を示しています。NSA信号には識別可能な音声情報が含まれておらず、スピーカーのプライバシーが保護されています。これは、継続的なウェアラブルモニタリングに重要かつ必要です。当社のデバイスは、制御された実験室条件での耐久性および信号処理アルゴリズムについてすでにテストされています。 目的:この研究の目的は、職業上のボーカルユーザーのグループ、すなわち、生態学的に有効な環境で職場で声を広範囲に使用する音声俳優のグループで、機器と分析の両方の妥当性をさらに評価することを目的としています。 方法:この研究には、合計16人のプロの音声俳優(21〜50歳、女性11人と男性5人の男性)が参加しました。すべての参加者には、声の演技と音声評価セッション中に、胸骨ノッチにNSAがマウントされました。音声演技セッションは4時間の長さで、プロのサウンドスタジオのボイスディレクターが監督しました。音声評価セッションは、演技セッションの前、最中、および48時間後に実施されました。評価には、通過測定の紙張りの課題、持続的な母音、最大母音の発音、ピッチグライドが含まれていました。臨床音響メトリック(例えば、基本周波数、cepstral測定)と声量測定値(つまり、演技から蓄積された距離用量)をNSA信号から計算しました。一般的に使用されるオンラインアンケート(自己管理音声評価アンケート)も、参加者のボーカル疲労に対する認識を追跡するために実装されました。 結果:NSAウェアラブルは、演技中に積極的な体の動きにもかかわらず、すべての参加者のために留まりました。その後のボディノイズは、NSA信号の品質を妨げませんでした。計画されたすべての音響メトリックは、NSA信号から成功裏に導出され、それらの数値は文献データに匹敵しました。4時間の音声演技では、平均距離用量は約8354 mで、性差はありませんでした。参加者は、音声演技の開始から2時間後に声の疲労を認識し、演技セッションの24〜48時間後に回復しました。フォネレーションタスク全体のすべての音響メトリックの中で、パッセージからのcepstralピークの隆起とスペクトルの傾きは、知覚された疲労において最も密接に反映された傾向を読みます。 結論:社内のNSAウェアラブルの生態学的妥当性は、職場の環境で吟味されました。このウェアラブルの重要なアプリケーションの1つは、正式な保護のために声の安全性の制限に到達したときに職業音声ユーザーを促すことです。したがって、信号処理アルゴリズムは、累積距離用量、ケプストラルピークの隆起、スペクトルチルトなど、臨床的に関連するメトリックのほぼリアルタイム推定のためにさらに開発できます。この機能により、職業音声ユーザーの声の行動と声の安全性の保護の継続的な自己認識が可能になります。

背景:首の表面加速度計(NSA)ウェアラブルデバイスは、音声および気道の健康監視のために開発されています。音響音とは対照的に、NSAは声帯から首の皮膚に伝播された機械的振動を感知します。これは、人の声と気道の状態を示しています。NSA信号には識別可能な音声情報が含まれておらず、スピーカーのプライバシーが保護されています。これは、継続的なウェアラブルモニタリングに重要かつ必要です。当社のデバイスは、制御された実験室条件での耐久性および信号処理アルゴリズムについてすでにテストされています。 目的:この研究の目的は、職業上のボーカルユーザーのグループ、すなわち、生態学的に有効な環境で職場で声を広範囲に使用する音声俳優のグループで、機器と分析の両方の妥当性をさらに評価することを目的としています。 方法:この研究には、合計16人のプロの音声俳優(21〜50歳、女性11人と男性5人の男性)が参加しました。すべての参加者には、声の演技と音声評価セッション中に、胸骨ノッチにNSAがマウントされました。音声演技セッションは4時間の長さで、プロのサウンドスタジオのボイスディレクターが監督しました。音声評価セッションは、演技セッションの前、最中、および48時間後に実施されました。評価には、通過測定の紙張りの課題、持続的な母音、最大母音の発音、ピッチグライドが含まれていました。臨床音響メトリック(例えば、基本周波数、cepstral測定)と声量測定値(つまり、演技から蓄積された距離用量)をNSA信号から計算しました。一般的に使用されるオンラインアンケート(自己管理音声評価アンケート)も、参加者のボーカル疲労に対する認識を追跡するために実装されました。 結果:NSAウェアラブルは、演技中に積極的な体の動きにもかかわらず、すべての参加者のために留まりました。その後のボディノイズは、NSA信号の品質を妨げませんでした。計画されたすべての音響メトリックは、NSA信号から成功裏に導出され、それらの数値は文献データに匹敵しました。4時間の音声演技では、平均距離用量は約8354 mで、性差はありませんでした。参加者は、音声演技の開始から2時間後に声の疲労を認識し、演技セッションの24〜48時間後に回復しました。フォネレーションタスク全体のすべての音響メトリックの中で、パッセージからのcepstralピークの隆起とスペクトルの傾きは、知覚された疲労において最も密接に反映された傾向を読みます。 結論:社内のNSAウェアラブルの生態学的妥当性は、職場の環境で吟味されました。このウェアラブルの重要なアプリケーションの1つは、正式な保護のために声の安全性の制限に到達したときに職業音声ユーザーを促すことです。したがって、信号処理アルゴリズムは、累積距離用量、ケプストラルピークの隆起、スペクトルチルトなど、臨床的に関連するメトリックのほぼリアルタイム推定のためにさらに開発できます。この機能により、職業音声ユーザーの声の行動と声の安全性の保護の継続的な自己認識が可能になります。

BACKGROUND: Neck surface accelerometer (NSA) wearable devices have been developed for voice and upper airway health monitoring. As opposed to acoustic sounds, NSA senses mechanical vibrations propagated from the vocal tract to neck skin, which are indicative of a person's voice and airway conditions. NSA signals do not carry identifiable speech information and a speaker's privacy is thus protected, which is important and necessary for continuous wearable monitoring. Our device was already tested for its durable endurance and signal processing algorithms in controlled laboratory conditions. OBJECTIVE: This study aims to further evaluate both instrument and analysis validity in a group of occupational vocal users, namely, voice actors, who use their voices extensively at work in an ecologically valid setting. METHODS: A total of 16 professional voice actors (age range 21-50 years; 11 females and 5 males) participated in this study. All participants were mounted with an NSA on their sternal notches during the voice acting and voice assessment sessions. The voice acting session was 4-hour long, directed by a voice director in a professional sound studio. Voice assessment sessions were conducted before, during, and 48 hours after the acting session. The assessment included phonation tasks of passage reading, sustained vowels, maximum vowel phonation, and pitch glides. Clinical acoustic metrics (eg, fundamental frequency, cepstral measures) and a vocal dose measure (ie, accumulated distance dose from acting) were computed from NSA signals. A commonly used online questionnaire (Self-Administered Voice Rating questionnaire) was also implemented to track participants' perception of vocal fatigue. RESULTS: The NSA wearables stayed in place for all participants despite active body movements during the acting. The ensued body noise did not interfere with the NSA signal quality. All planned acoustic metrics were successfully derived from NSA signals and their numerical values were comparable with literature data. For a 4-hour long voice acting, the averaged distance dose was about 8354 m with no gender differences. Participants perceived vocal fatigue as early as 2 hours after the start of voice acting, with recovery 24-48 hours after the acting session. Among all acoustic metrics across phonation tasks, cepstral peak prominence and spectral tilt from the passage reading most closely mirrored trends in perceived fatigue. CONCLUSIONS: The ecological validity of an in-house NSA wearable was vetted in a workplace setting. One key application of this wearable is to prompt occupational voice users when their vocal safety limits are reached for duly protection. Signal processing algorithms can thus be further developed for near real-time estimation of clinically relevant metrics, such as accumulated distance dose, cepstral peak prominence, and spectral tilt. This functionality will enable continuous self-awareness of vocal behavior and protection of vocal safety in occupational voice users.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google