ハウリングキャンセラの開発
(Adaptive Howling Canceller)
English page is here
英文ページの1ページ概要資料へのリンク
プレス・リリースのページはこちらです.
2024.11.12 最新情報 : ピーク利得18dBでの安定動作を達成
- 適応ハウリング・キャンセラの性能向上のためにプログラムをこれ以上改良できる点は無いと思っていたのですが、微妙な収束特性の揺らぎが気になって調査したところ、まだ最適化が可能であることが分かりました. 非常に長時間の実験を丹念におこない、最終的にピーク利得18dBでも安定動作するところまでプログラムを改善することが出来ました. 低域の音声帯域外の不規則に周波数特性がうねるような収束特性の変動が完全に解消されて、常に0Hzに向かって利得が単調減少する安定した特性が得られています. decorrelator
の変調処理の改良などもあり、バイアス蓄積の問題も完全に解消されています.
上段:適応フィルタ係数をFFTした周波数特性
下段:適応フィルタ係数
- ピーク利得20dBでも問題なくハウリング抑圧は可能ですが、20dBでは若干カサカサ聞こえるような歪・雑音が拡声音に混じることがあります.(音響系の伝達特性の揺らぎ等により実験結果が安定しません)
- ハウリング・キャンセラ無しの拡声システムではハウリング・マージンを確保するためにはピーク利得は-3dB~-2dB程度以上には出来ないことを考えると、ピーク利得18dBで動作するハウリング・キャンセラは20dBの利得増大効果が得られることになります. しかもピーク利得18dBを越えるとすぐにハウリングが発生するわけではなく、+2dB~+3dB以上のマージンを確保出来ます.
ただし、一般的な拡声システムとしてはピーク利得18dBはゲイン過大で、6dB~10dB程度のゲイン設定での運用が妥当と考えられます.
- 利得の定義や測定方法の違いなどから単純な比較は出来ないのですが、20dBのゲインは軽度難聴向けの補聴器に匹敵する性能です. 例えば不特定の高齢の外来利用者の多い施設・病院等で補聴器ならぬ補聴拡声装置として使用することも出来るでしょう.(天井吊り/天井埋め込み式のマイクを使用)
- 当社のハウリング・キャンセラ技術を軽度難聴向けの補聴器に適用すれば、外耳道を塞がない完全なオープン・エア型の補聴器も実現可能です. 最近、Apple の AirPods が補聴用途に利用できるようになったというニュースがありましたが、そのような製品にも適用出来るでしょう.
補聴器や医療器具としての認定を受けていない補聴器モドキの中には Qualcomm の Bluetooth レシーバ用LSIを用いているものがあるそうですが、出来れば Qualcomm の評価キットを使って実験してみたいと思っています.(市販されている
Qualcomm 純正のイヤーレシーバー型評価キットと開発ライセンスを購入すれば誰でも自前のプログラムを組み込んで実験可能です)
2024.9.30 最新情報 : 適応システムの基本構成と適応ハウリング・キャンセラ
- 適応ハウリング・キャンセラを理解するには適応フィルタ/適応システムの知識が必要です. しかしながら、適応システムの基本構成について意外とご存じない方が多いようなので、適応ハウリング・キャンセラの構成も含めて簡単な説明資料を作成しました.
適応システムの基本構成と適応ハウリング・キャンセラ adaptive_system_basics_and_adaptive_howling_canceller.pdf
2024.9.30 最新情報 : 定在波の影響による適応ハウリング・キャンセラの歪
- 適応ハウリング・キャンセラの性能向上のために、安定動作可能な上限まで利得を上げて実験をおこなっていたところ、定在波に起因する音響系の伝達特性の揺らぎによって歪が発生することが確認されました. 実用レベルの利得設定では音質上の問題となることはありませんが、今まで知られていなかった現象なので少し調べてみました. フィードバックの影響、バイアス発生により、わずかな伝達特性の変動でも歪が発生するようです.
定在波の影響による適応ハウリング・キャンセラの歪 adaptive _howling_canceller_distortion_by_standing_wave.pdf
2024.9.23 最新情報 : 適応ハウリング・キャンセラの動作原理
- 適応ハウリング・キャンセラの動作原理をご存じ無い方が多いようなので、簡単な説明資料を作成しました.(一部その他の関連情報も含みます)
ただし、基本構成・基本動作に関するもので、入力信号の周波数特性補正前処理や decorrelator の変調処理の詳細、安定動作するための位相特性の制約条件、バイアス蓄積対策のための
dither 信号付加等については触れていません.
適応フィルタについては既知であるとして、適応フィルタ/適応アルゴリズムについての説明は省略しています. 基本的にはシステム同定の構成の適応システムにフィードバックがかかっているだけなので理解の困難なところは無いはずです.
適応ハウリング・キャンセラの動作原理 adaptive_howling_canceller_basics.pdf
2023.9.13 最新情報 : 6角配列マイクロホン・アレイの実験結果
- 残響時間1秒のスタジオで6角配列マイクロホン・アレイの実験をおこない、その有効性を確認しました. 指向特性の緩やかなアレイでも拡声音のエコーが大幅に低減されました. 別の大学の研究室でのデモでも、良好な効果が得られることを確認しました.
- もともと6角配列アレイは天井吊り/天井埋め込みでの使用を想定したものですが、天井の高いスタジオなので普通の指向性マイクと同様にマイクロホン・スタンドにセットした状態で実験しました. マイクとスピーカーの位置関係は下図のようになります.
マイク/スピーカー間の波数特性を調べると、6角配列アレイは二項アレイと同様の非常に素直な特性を有していることが分かります.(顕著なヌルが無い)
上段:適応フィルタ係数をFFTして求めたマイク/スピーカー間の周波数特性
下段:適応フィルタ係数(音響系のインパルス・レスポンス)
下記は無指向性マイク(音場型マイク、全指向性マイク)の場合の、マイク/スピーカー間の波数特性です.
上段:適応フィルタ係数をFFTして求めたマイク/スピーカー間の周波数特性
下段:適応フィルタ係数(音響系のインパルス・レスポンス)
2023.9.13 最新情報 : バイアス蓄積量の推定値の評価に基づく全体最適化
- バイアス蓄積量の推定値に基づく最適化をおこなったのですが、その後も長時間の連続動作実験を実施したところ、これ以上の最適化の必要は無いと考えて何年間も手を入れていなかった部分にもまだまだ改善の余地があることが分かりました. 修正前後の特性の差が非常に微妙で大変だったのですが、あらためて処理全体の最適化作業をおこないました. 単純なエンファシス/ディエンファシスのパラメータを少し変えただけでも、特性が大きく変化することに驚きました.(decorrelatorが理想特性では無いことが、いろいろな部分に影響しているようです)
- 全体最適化の結果、従来よりも2dBアップのピーク利得17dBでも安定動作が可能になりました. 冷蔵庫のコンプレッサ・オン時(周期性雑音入力時)の動作の安定性も改善されました.
- 家電製品やキッチン・タイマー等のピーピー鳴る電子音/警報音入力時の収束特性の乱れも小さくなりました. 鍋/フライパンや薄手の磁器の椀を叩いたときの衝撃音入力時の安定性も非常に良くなりました.
- ちょうど季節の変わり目でエアコンをオン/オフしたり、窓を開け閉めしたりして実験したところ、家庭用エアコンの室外機の周期性雑音は適応フィルタの収束特性に悪影響を与えるものの、微風モードで運転時の室内機のノイズは逆にバイアス蓄積量低減の効果があることが分かりました.
室内機には羽の枚数が非常に多いクロスフロー・ファンを用いているために白色雑音様のファン・ノイズとなり、かすかに雨音が聞こえる程度の雨の日に収束特性が良くなるのと同じ現象が生じているようです.
- 微小レベルの暗騒音の影響の調査・解析、対策はおそらくもう限界です.
- バイアス蓄積量の推定値の評価から、適応フィルタ長には最適値があることもはっきりしました. 音響系のインパルス・レスポンス長/部屋の残響時間に応じて適切な適応フィルタ長の設定をする必要があるようです.
ピーク利得約17dBでの実験時の適応フィルタ係数(音響系のインパルス・レスポンス、サンプリング周波数8kHz) w.txt(行番号無し) w2.txt(行番号あり)
起動後24時間経過後の適応フィルタ係数(下段)と
適応フィルタ係数をFFTした周波数特性(上段)
2023.5.11 最新情報 : 6角配列マイクロホン・アレイの製作
- 大きなスタジオで実験させてもらった時に、本来は適応ハウリング・キャンセラ向きでは無いにもかかわらずボーカル用の単一指向性マイクロホン(音圧傾度型マイクロホン)を使用すると残響低減に大きな効果があることを確認出来ました. もともと暗騒音の影響軽減のために二項アレイの形式のマイクロホン・アレイを検討していたのですが、さっそく製作が簡単な実験用の6角配列マイクロホン・アレイを作ってみました. 製品としては天井吊り/天井埋め込み式で使用することを想定しています.
- 7素子の6角配列アレイで、3x3=9素子の2次元2項アレイと同等の特性が得られます. ただし、2項アレイのように完全にサイドローブが無いのではなく約3kHz以上で小さなサイドローブが出ます.(実用上は問題ありません) 鋭すぎず、ゆるすぎない実用上適当な指向特性です.
- 6角配列アレイは重み付け係数をつける必要が無いので回路が簡単になります. 7素子の出力の単純加算で、安物のエレクトレット・コンデンサマイクのランダム雑音を1/sqrt(7)=1/2.645=0.378倍に低減、S/N比8dB向上の効果が得られます. 製作したアレイにはカメラ用三脚への取付け用のネジ穴をつけてあるので、普通のボーカル収録用のマイクとして使用することも可能です.(視覚的には邪魔ですが) 普通の音圧傾度型マイクロホンとは異なり近接効果はありません.
- 製作したマイクロホン・アレイを使って近日中にスタジオや教室で実験させてもらう予定です.
2つの指向特性のグラフはアレイを30°回転させたものになります
- 用途を考えると、そこそこの指向特性が得られれば必要十分なので、特性についてあまり細かいことを気にしても仕方ありません. 使用しているマイク素子の感度のバラツキもあるので、手間をかけて指向特性の実測をするほどのものでもありません.
2023.5.11 最新情報 : バイアス蓄積量の推定値に基づく最適化
- 丹念に細かい最適化の実験を繰り返しているうちに、比較的簡単な演算で適応フィルタのバイアス蓄積量の推定値を求められることが分かりました.
音響系に本質的な伝達特性の揺らぎや暗騒音特性の変動のために最適化作業は非常に困難だったのですが、バイアス蓄積の推定値に基づいた最適化が出来るようになってさらに安定性を改善することが出来ました. システム全体の位相特性に関してもより安定した動作の出来るように微調整をすることが出来ました.
- バイアス蓄積量の評価によって、適応ハウリング・キャンセラの安定動作にはディザ信号付加が不可欠であることも確認出来ました. 位相特性を最適化すればディザ信号無しでも安定動作は可能ですが、音響系の特性の急な変動や高レベルの周期性雑音入力があった場合にバイアスが増大します. どんどんバイアスが蓄積して動作が不安定にな
ることは無いのですが、バイアス発生の原因が無くなってもなかなかバイアス蓄積量が低下しません.(回復の時定数が非常に長い) 元のバイアス蓄積レベルに戻る前に再び外乱によってバイアスが増加するのは好ましいことではありません. 結局、現在の技術レベルではディザ信号を無くすことは出来ないようです..
- 実験結果からは、適応ハウリング・キャンセラのバイアス問題は理論的な適応アルゴリズムの問題というよりも、数値計算上の問題・有限語長演算の問題ではないかと思われます. 静的な収束特性の解析やシミュレーションを頼りに解決出来るような素直な問題では無いでしょう.
- 実際の実験時のバイアス蓄積量の推定値のグラフを下記に示します.
3段のグラフの上2つ(coef1, coef2)は入力信号の周波数特性補正用のフィルタの係数です.(ハウリング抑圧用とは別の、一種の適応フィルタで補正をおこなっています) 最下段がバイアス蓄積量の推定値です. バイアス蓄積量は入力信号の周波数特性の変動や周期性雑音レベル(冷蔵庫のコンプレッサのON/OFF)によって変化しています.
適切なディザ信号を付加してあるので、バイアス発生要因が無くなればすみやかにバイアス蓄積量は低下します. バイアス蓄積量の推定値に応じてディザ信号レベルを制御しています.
最下段がバイアス蓄積量の推定値
適当な基準値を元にdB表示しています
0dBのラインに特別な意味はありません
2023.1.16 最新情報 : スタジオ、教室での実験結果
- スタジオと教室でのハウリング抑圧実験結果を下記に示します. いずれもピーク利得10dB以上でハウリング抑圧が出来ました.
グラフの上段は適応フィルタ係数をFFTした周波数特性、下段は適応フィルタ係数(インパルス・レスポンス)です.
- スタジオは残響時間1秒の小ホールと言っても良いくらいの天井が高く容積の大きいところです. 実験に用いたDSPを用いたデモ機が対応可能な残響時間の上限は約0.5秒なのですが、ややエコーが大きめになるものの問題なくハウリング抑圧が可能でした. 本来、適応ハウリングキャンセラには適さない単一指向性(音圧傾度型)マイクロホンを用いての実験もおこないましたが、エコーが大幅に軽減されることを確認出来ました.(暗騒音の影響を軽減するための指向性マイクロホンとしては二項アレイが適しています)
- 教室は周期成分を含む空調雑音がかなり大きかったのですが、ハウリング・キャンセラの動作に問題はありませんでした.
2022.9.26 最新情報 : デモ・プログラム公開
- AudioKitの製品紹介ページから、適応ハウリング・キャンセラのデモ・プログラムをダウンロード可能です. Windows PCとUSB接続オーディオ・インターフェースを用いて適応ハウリング・キャンセラの実験が可能です. あくまでもハウリング・キャンセラの基本構成のみを実装したもので、製品レベルの性能ではありません.
2022.9.1 最新情報 : AudioKit製品情報紹介ページ作成
- PCとUSB接続オーディオ・インターフェースを用いて音声・音響信号の実時間処理ステムの研究開発をおこなうためのAudioKitの製品紹介ページを作成しました. AudioKitには適応ハウリング・キャンセラのデモ・プログラムも含まれていて(ソースコード込み)、ハウリング・キャンセラやエコー・キャンセラの開発に用いることも可能です.
- 製品紹介ページから各種デモ・プログラムをダウンロード可能ですが、近日中に適応ハウリング・キャンセラのデモ・プログラムも追加する予定です. ただしデモ・プログラムはハウリング・キャンセラの基本原理のみを実装したもので、音質・動作の安定性は実用レベルのものではありません.
- ハウリング・キャンセラのデモ・プログラム実行にはASIOに対応した(メーカーからASIOドライバが提供されている)オーディオ・インターフェースが必要です. 廉価な製品としてはZOOMのU-22があります.(ZOOMはWeb会議のZoomとは別の日本の会社です) U-22は他社の同種製品と比較して遅延(latency)は大き目ですが、latencyのドリフトが少なく動作が安定しているという特徴があります.
- ASIO対応のオーディオ・インターフェースはバランス入出力のものも多くて、不平衡接続のケーブルを接続するには変換アダプタが必要になります.
022.8.26 最新情報 : 位相特性・ディザー信号特性の最適化、処理アルゴリズムの完全fix
- 適応フィルタを用いたハウリング・キャンセラが安定動作するための位相特性の制約条件が実験的に明らかになり、全体の細かい最適化作業がうまく進んで、処理アルゴリズムがほぼ完全にfixしました.
- 複数のディザー信号を組み合わせて用いていて、一部はフィルターを使って帯域制限しているのですが、その特性に関しても実験的に最適化することが出来ました.
擬似乱数を帯域制限するとフィルターのインパルス・レスポンスが畳み込まれて位相特性、自己相関特性が変化してしまうのですが、帯域制限用フィルターの最適な位相特性が分かりました. 非常に微妙な問題ですが、フィードバックがかかっているのでわずかな特性の差異が適応フィルターの収束特性とバイアス打ち消し特性に影響を及ぼすことが実験結果からはっきり分かります.
- 今までよりディザー信号レベルを大幅に小さくしても、安定性を保つことが可能です. マイク位置の大きな変化や周期性雑音入力があってもバイアス蓄積は生じません. 状況に応じてディザー信号レベルを増減できるマージンも十分にあります.(ディザー信号レベル過大でも過小でも悪影響が出る場合があります)
- 全体の最適化が終わって冷蔵庫のコンプレッサー・ノイズ(周期性雑音)の有無によるバイアス発生量の相違が実験結果からはっきり分かるようになりました.(コンプレッサー動作時でも安定性には問題ありません)
見方を変えれば現在のバイアス発生量の推計値の計算方法は適切で、正確にバイアス発生状況のモニタリングが出来るようになったということです.
- 冷蔵庫のコンプレッサー動作時は適応フィルタの約200Hz以下の利得(減衰量)がかなり揺らぐのですが、雑音レベルや音響系の特性の変動の影響で自然に変化しているという印象です. 何か未知の意図しない干渉現象によって歪/バイアスの打ち消し処理が理想的におこなわれていないのではないかと思わせるような、不規則に細かく波打つ周波数特性の暴れは皆無になりました.
上段:適応フィルタ係数をFFTして求めた周波数特性(拡声系の利得)
約200以下の利得は0Hzまでほぼ単調に減少している
下段:適応フィルタ係数
起動後12時間経過した状態での測定結果
2022.5.27 最新情報 : バイアス蓄積問題の根本解決
- 今まで対症療法的にディザー信号付加で対処していたバイアス蓄積の問題を根本的に解決することが出来ました. 常識的な使用環境であれば拡声システムの位相特性がある制約条件を満たせばディザー信号無しでもバイアス蓄積は生じずに適応ハウリング・キャンセラが安定動作することが判明しました.
動作条件が厳しくて位相特性を最適化した状態でもバイアス蓄積の問題が現れる場合は、適切な特性を有する微小な信号レベルのディザー付加で対処できることが分かりました.
- 長年にわたる開発に一区切りがついたところで、非常に散漫な内容ながらも適応ハウリング・キャンセラについての考察をまとめました.
2022.5.7 最新情報 : なぜ適応ハウリング・キャンセラの論文のブロック・ダイアグラムの描き方はヘタなのか?
- これからハウリング・キャンセラの勉強をしたい・実験をしたいという方のために、論文に載っている図に関しての考察をまとめました.
適当に図面の孫引きをしている論文が意外と多いのです(?!)
2022.5.7 最新情報 : 適応ハウリング・キャンセラ向け2次元配列マイクロホン・アレイ
- 適応ハウリング・キャンセラ向けの天井吊り/天井埋め込み式の2次元配列マイクロホン・アレイの資料をまとめました.
2022.1.31 最新情報 : パソコンと外付けUSBオーディオI/Fを用いたハウリング抑圧実験結果
- Windowsパソコンと外付けUSBオーディオI/Fを用いて構成したハウリング・キャンセラでのハウリング抑圧実験結果を下記に示します. あくまでも基本的な構成でのハウリング抑圧プログラムなので、音質等は実用レベルのものではありません. 使用しているUSBオーディオI/Fのlatency(遅延)が大きいことも実用には適しません.
- decorrelatorには5Hzの周波数シフトを用いています. USBオーディオI/Fの大きなlatencyもdecorrelatorとして有効に働くため、意外なほど適応フィルタの収束特性は安定でバイアス蓄積の問題も見られないようです.(長時間の安定性確認実験はまだおこなっていません)
- 実験システムのブロック・ダイアグラムは下記のとおりです. USBオーディオI/F U-22 (Zoom) のサンプリング周波数は48kHzですが、ハウリング抑圧の処理はサンプリング周波数8kHzでおこなっています.
- ピーク利得は10dBの設定で実験しています. 拡声音の音質は実用レベルのものではありませんが、ハウリングは発生せず安定です.
パソコンの演算能力が高いため、適応フィルタのタップ長8000tapでもプログラムは実時間動作します. 8000tapであれば、残響時間2秒の大ホールでもハウリング抑圧実験が可能です.
適応フィルタ・タップ長 2048tap
上段:適応フィルタ係数をフーリエ変換して求めた周波数特性
下段:適応フィルタ係数
適応フィルタ・タップ長 8000tap
上段:適応フィルタ係数をフーリエ変換して求めた周波数特性
下段:適応フィルタ係数
2022.1.29 最新情報 : 処理アルゴリズム完全fix、 ピーク利得15dBでも実用レベルの安定動作を達成
- いったんは適応ハウリング・キャンセラのアルゴリズム開発は終わったと思っていたのですが、安定性確認のための長時間連続運転実験を繰り返しているうちに、非常に細かいことで気になることが出てきました. 改めて時間をかけてさらに詳細な改良作業をおこなったところ、今までやや過大気味だったディザ信号レベルを大幅に下げても安定に動作するようになりました. 原因不明だったDC端の収束特性の不規則な揺らぎも解消され、これで本当に処理アルゴリズムが完成しました.
ピーク利得15dBの設定でも、実用レベルの音質で安定に動作します.(話者がマイクの近くにいても問題ありません)
- 微妙な最適化の作業をおこなって分かったことは、安定性向上のためにはシステム全体の位相特性の設定・管理が重要だということです. 極力、余剰な位相回転と意図しない位相特性の変動を排除するが性能向上の鍵です.
- アンプ回路の設計のようにボーデ線図を描いて解析をおこなったり、スタガ比の設定を考えたりすることが出来ないため、試行錯誤的に処理の最適化をおこなったのですが、結果として素直な位相特性を持つシステムを実現することが出来ました.
位相特性の最適化によってディザ信号付加による歪・バイアスの打消しの効果が向上するために、ディザ信号の信号レベルを下げることが出来ました.
- decorrelatorには微小量の遅延と変調処理を用いています. フィードバックのかかったシステムの中で変調処理をおこなうということは、発生した歪・バイアスを帯域内全体にスペクトラム拡散していることになり、ディザ信号による歪・バイアス打消しに影響します.
位相特性の最適化は、変調処理による歪・バイアスの均一な拡散にもプラスになっていると考えられます.
ピーク利得15dBの設定での実験結果
上段:適応フィルタ係数をフーリエ変換して求めた周波数特性
下段:適応フィルタ係数
- 適応ハウリング・キャンセラの性能向上は安定動作可能なピーク利得の上限を引き上げただけではありません. 今まではマイク位置固定での使用を想定していましたが、ピーク利得2dB~3dB程度であればマイク位置可変でもハウリング抑圧できるようになりました.
- 従来、ハウリング対策用として市販されているノッチフィルタ、フィルタ・バンク/GEQ(Graphic EQualizer)ベースの製品は、基本的には周波数特性平坦化の効果しかなく、安定して0dB以上の利得を実現することは出来ません.(ハウリングが発生したら、その周波数の利得を下げるという動作をするので、一応マイク位置可変でも使用可能です)
改良した適応ハウリング・キャンセラはこれらの既存製品を完全に置き換えることも可能であると考えられます. 今後は様々な環境で、マイク位置可変でのハウリング抑圧特性確認の実験をおこなう予定です.
2021.5.13 最新情報 : ピーク利得15dB/20dB/25dBでの適応ハウリング・キャンセラの動作状況
- 今まで何度もハウリング・キャンセラの性能改善はもう限界で終わりと思っても、性能が良くなれば良くなっただけ微妙な動作特性の違いがはっきり分かるようになって、細々とした最適化の作業が完了しませんでした. ようやくピーク利得20dB~25dB程度でもハウリングが発生せず安定するほどになったので、これで本当に終わりという感じです.
- ピーク利得15dB/20dB/25dBでの収束特性のデータを下図に示します. 下段が適応フィルタ係数、上段が係数をフーリエ変換して求めた周波数特性です.
- 利得が大きくなるほどハウリング・キャンセラの動作は音響系の特性変動に敏感になります. ピーク利得15dBでは人がマイクから1.5m程度離れれば問題なく正常に拡声動作します.
- ピーク利得20dB以上では少し人が動くとハウリングはしないものの、ヒーヒー、ヒュンヒュンという異音が発生します. 床にじっと寝そべって発声すれば安定動作するものの、暗騒音レベルの上昇を無視できなくなるので実用はちょっと無理です. 無人の防音室の中で実験すれば、おそらくピーク利得30dB以上でも安定状態を維持出来るでしょう.
- 当初はピーク利得6dBでの動作がやっとだったものが25dBでも安定するようになったのは、もろもろの歪/バイアス発生が十分に抑えられて理論どうりに適応フィルタが収束するようになったということです. フィードバック・パスを切り開いたオープンループ・モデルを考えると、(常識に反して)理論的には拡声系の利得が大きいほど収束特性が向上することはシミュレーションで確認されていましたが、実時間動作するハウリング・キャンセラでもそれが実証されたと言えます.(ただし音響系の特性変動が無い場合)
2021.5.7 最新情報 : 直線位相近似・ガウシアン特性近似IIRフィルタの効果
- 音声・音響信号処理には通常Butteworth特性のフィルタを用いることが多いのですが、ハウリング・キャンセラでは直流の制御信号の処理のために直線位相近似・ガウシアン特性近似IIRフィルタを用いています. 最近までこのような特性のIIRフィルタの系統的な設計手法があることを知らなかったのですが、試してみるとハウリング・キャンセラの動作特性改善に大きな効果があることが分かりました.
- Butterworth特性IIRフィルタと直線位相近似・ガウシアン特性近似IIRフィルタの設計例を比較すると下図のようになります.
- Butterworth特性IIRフィルタの設計例(サンプリング周波数8kHz、左より 利得、位相、インパルス・レスポンス)
- 直線位相近似・ガウシアン特性近似IIRフィルタの設計例(サンプリング周波数8kHz、左より 利得、位相、インパルス・レスポンス)
- Butterworth特性フィルタのインパルス・レスポンスは正負に振れる減衰振動特性を有していて、直流の制御信号の処理には向いていないことが分かります.
- 一方、直線位相近似・ガウシアン特性近似IIRフィルタのインパルス・レスポンスのマイナス方向への振れは非常に微小で、『制動が良く利いている』ことが分かります. FIRフィルタと見まがうばかりの特性ですが、FIRフィルタよりも少ない演算量でガウシアン特性を近似できるのがメリットです.
- 画像処理や無線の変調処理でガウシアン特性のフィルタが用いられることは知っていましたが、このような『特性の甘い』フィルタをハウリング・キャンセラに使うメリットがあることはやってみるまで分かりませんでした. これも適応ハウリング・キャンセラの従来の常識と反するような性質の一つです.
2021.4.19 最新情報 : ハウリング・キャンセラのコロナウイルス感染予防への応用
2021.4.19 最新情報 : ピーク利得10dBでの安定動作を達成
- 適応ハウリング・キャンセラのソフト開発/アルゴリズム開発はもう終わりと思っていたのですが、その後も細かい改良・改善を加えたところ、ピーク利得10dBでも安定動作するようになりました. ピーク利得15dBでもハウリングは発生しませんが、音響系の伝達特性の変化に非常に敏感になるために身じろぎ一つせず直立不動で発声しないと拡声音が不自然になります.
- 実際の拡声システムではピーク利得6dB~8dB程度の設定で必要十分ではないかと思われます. これだけ十分な動作マージンがあれば、別記のコロナウイルス感染予防への応用も可能でしょう.
起動後8時間
上段:適応フィルタ係数をフーリエ変換して求めた周波数特性
下段:適応フィルタ係数
2021.1.29 最新情報 : 補聴器のハウリング・キャンセラの論文の記述
- 補聴器のハウリング・キャンセラの論文で、音声の性質について不適切な記述をしているものが多いので資料をまとめました.
音声は白色化・無相関化されない reverse_filter.pdf(350KB)
- 補聴器が処理対象とする信号は音声なのに、補聴器の研究をしている人は音声について無関心なのでしょうか?
2021.1.28 最新情報 : パワーアンプの交換(アナログ系の雑音の影響)
- 実験に使っていたパワーアンプを雑音の少ないものに交換しましたが、それだけでもハウリング・キャンセラの収束特性改善の効果があることを確認できました.
- 最初に使っていたのはBOSEの1705II(出力20W)ですが、その後は外でデモをする都合もあって「stereo」誌(音楽之友社)付録のLXA-OT3(出力16W)をケースに入れたものを使用していました. 今回はさらにJBLのCSA-2120(出力120W)に交換しました.
- 今まで使用していたLXA-OT3は小型のデジタルアンプ基板で、電源を含めても1705II(2.6kg)より非常に軽量です. ただし、このアンプは据置型のCDプレーヤに直結して使用することを想定したかなり控えめなゲイン設定になっていたので、各種実験用にゲイン・アップの改造をして使っていました.
- LXA-OT3をゲイン・アップした分のS/N低下が気になったこともあり、このたび大出力でS/Nの良いCSA-2120に交換したしだいです.(重量は1kgで、出力のわりには非常に軽量です)
- まともなメーカーのまともな設計のアンプなら、大出力のものほどS/N特性は良くなります.(というか残留雑音を増やさないために、S/Nがより良くなるように設計されています) 出力20Wの1705IIのS/Nが85dBであるのに対して、出力120WのCSA-2120のS/Nは100dBです. 同一出力で使用するなら、CSA-2120の方が10dB以上雑音が小さくなります
- 同様にマイク、マイク・アンプもS/N特性に関して注意が必要です.
- マイクには市販のエレクトレット・コンデンサ・マイクを使用していますが、現在はS/N特性の良い専用アンプICを内蔵した少しお値段の高いものを使っています. マイク内蔵のアンプ/インピーダンス変換器にFETを用いているものより、10dB程度S/Nが良好です.(専用アンプICの例:MAX9810)
- マイク・アンプはずっとaudio-technicaのAT-MA2を使用しています. この製品のS/N特性について特に問題となるところはありません. ただし、電源のACアダプタ経由で消費電力の大きい機器からのノイズの回り込みが発生することがあるので、いずれ電池動作のマイク・アンプを自作しようと思っています.
- 全体としては、アナログ系のノイズ特性に関して細心の注意を払う必要はあるが、ハウリング・キャンセラの性能を発揮するために現在の市販の拡声機器の性能水準を超えるほどの低雑音が要求されるわけでは無い~というところです.
2020.12.11 最新情報 : dither付加処理、入力信号周波数特性補正処理、decorrelator処理の全体最適化
- dither付加により、どうにかこうにか適応フィルタのバイアス/歪蓄積の問題に対処して実用レベルの性能のハウリング・キャンセラを実現出来たのですが、dither信号レベルがかなり過大であることがずっと気になっていました.
- その後、丹念に長時間連続運転実験を繰り返して他の処理も含めた全体最適化をおこない、dither信号レベルを大幅に低減することに成功しました. 過大だったditherレベルが20dB以上小さくなったため適応フィルタの収束性能は向上して、音質低下無しに使用可能な最大利得が6dBから8dB程度まで改善されました.(ピーク利得が8dBを超えても拡声音がキンキンするだけで、利得10dB以上でもハウリングは発生せず安定です)
- バイアス/歪発生の要因はいろいろ考えられますが、適応フィルタの収束特性を改善するための入力信号の周波数特性補正処理とdecorrelatorの変調処理からも歪が発生します.
周波数特性補正処理は時変処理であるために、入力信号特性の変動に応じて歪が発生します.
フィードバックがかかったシステムの中で変調処理をするということは、発生した歪を帯域全体にスペクトラム拡散することになります.
処理遅延の厳しい制約があるために、理想特性の変調処理を実現できず変調処理そのものも歪を発生します. 厄介なことに変調のキャリア信号の漏れまで発生します.
これらの歪がdither信号と干渉するために「何がなんだか分からない」状態に陥ります.
- 何がなんだか分からないながらも手探りで丹念に実験を繰り返して、処理全体の最適化にようやく成功したというところです. その他の問題に対処するための各種補助処理の最適化もおこない、トーン信号(電子機器等の発生する電子音etc)入力時や、マイク位置が急激に変化した場合の適応フィルタの収束特性も改善されました.
- 下のグラフは24時間連続運転実験の結果です.(左から2時間経過、12時間経過、24時間経過) DC端、fs/2端ともに急峻に適応フィルタの利得が低下していて、バイアス蓄積の兆候はありません.
- ハウリング・キャンセラの性能が改善されると、かえって交通騒音や集合住宅の生活雑音の一日の変動の影響が実験結果からはっきり分かるようになって、処理改善の効果を確認するために24時間連続運転実験を繰り返すのは大変でした.
2020.2.12 最新情報 : 余剰な位相回転についての考察
- 理想的には収束した適応フィルタ係数は音響系のインパルス・レスポンスそのものになるはずですが、今までの実験データを見るとあまり綺麗な特性とは言えないものが多いようです. 教科書的な直接音成分+初期反射成分+多重反射成分というレスポンスとはかなり異なり、余分な位相回転がついていることも分かります.
- 適応フィルタ係数の形状が音響系のインパルス・レスポンスとしては乱れている(ように見える)原因としては、以下のようなものが考えられます.
- 帯域制限された信号のサンプル値をsinc関数で補間せずに直線で結んでグラフを描いているから
- 明瞭なフラッター・エコーを確認できるほど拡散性が悪く、かなり狭い部屋(ダイニング・キッチン)で実験をしていてるから
- ペタペタ貼り付けた各種の補助処理による余分な位相回転が大きいから
- ΔΣ型A/D・D/A内蔵のマルチレート構成LPFの特性があまり良くないから
- 3.の補助処理の影響が気になって少し調べてみたのですが、最適化が進んで補助処理による余分な位相回転は必要最小限に押さえられていることを確認出来ました.
- 結局、適応フィルタ係数の見た目が良くないのは2.と4.の影響が大きいようです. 4. に関してはループバック・テストで確認したのですが、LPFの遮断特性があまり良くないことや完全な直線位相特性にはなっていないことと、何が原因かは不明ですが非整数値の遅延があることが影響しているようです. A/D・D/A LSIのデータシートの記述には不明瞭な部分や実測特性と明らかに矛盾する点があって非常に不可解です.
- はじめは実験結果の比較をやりやすくするために、位相補正処理を追加するなどしてグラフ表示されるインパルス・レスポンス形状を綺麗に整形しようかとも考えたのですが、原理的に波形(適応フィルタ係数)の見た目が良くないのは当然であることが分かったので、特別な対応はとらないことにしました.
- 下図は、マイクの位置を上下前後左右に10cm~15cm程度変化させたときのハウリング・キャンセラの適応フィルタ係数です.(カメラ用の自由雲台に取り付けたマイクの移動範囲内です) ダイニング・キッチン内での実験結果ですが、マイクの位置によって適応フィルタ係数の形状が顕著に変化することが分かります. 拡散性の良い大きな部屋で実験すれば、もっと見た目の綺麗なインパルス・レスポンス形状が得られます.
2020.1.30 ハウリング・キャンセラの応用の検討
- デモを見ていただいたお客様から教えていただいたのですが、ハウリング・キャンセラの応用例として In Car Communication (ICC) というものがあるそうです.
車の前席・後席間で会話をするのに拡声装置(マイク、スピーカーetc)を使用して、そのハウリング防止に使うらしいです.
- いずれEVが主流となり、静音化が進むことが確実な狭い車室内で拡声装置を使うなど大げさにしか思えませんが、調べて見ると内外のベンダーからハウリング・キャンセラを含むICCシステムやソフトウェアIPなどが販売されているようです.
- 当社のハウリング・キャンセラはこのような用途にも適用可能ではありますが、残響時間が短く人の移動・運動による音響系のインパルス・レスポンス変動が大きくなる狭い車室内は動作環境としては不利です. 車ではわざわざ適応フィルタを用いずとも、従来のノッチフィルタ・ベースの手法で必要十分ではないでしょうか?
- 適応ハウリング・キャンセラの(音響学の一般常識に反する)驚くべき性質の一つは、残響時間が長い方が制御が安定するということで、残響が短いほど不利になります.
車と同様に比較的残響時間の短い室内で用いるカラオケ向けへの適用にも十分な検討が必要であると思われます.
- 車業界の人たちがICCを使いたがる理由の一つは、後席の人の声は前席によく届くが、前席の人の声の音圧レベルが後席では小さくなることにあるようです.
- しかし、その対策としてハウリング・キャンセラを必要とするほど利得を上げた拡声装置を使用するというのは短絡的な発想でしょう. 拡声装置の利得を抑えてもコンプレッサをうまく使えば聴感上十分な音の大きさ増大の効果が得られるはずですし、その程度の応用ではコンプレッサ使用による音質低下のデメリットが顕著に現れることは無いはずです.(車業界は車業界なので、音声・聴覚の専門家はいないのだと思います)
- 拡声装置を用いるのはより良い音声コミュニケーションのためであって、単に音量(拡声利得)が大きいほど良いというものではありません.
- 条件によっては音声処理システムの性能指標として音圧レベル/拡声利得などよりも了解度や音節明瞭度の方が適切な場合もあります. 言語的なメッセージ伝達の品位を調べる了解度試験や音節明瞭度試験がおこなわれることが少ない理由は、試験に手間がかかることと、このような試験方法があることを知らない人が多いからにすぎません.(まあ、昔の音質の良くない電話/国際電話のように了解度試験や音節明瞭度試験を必要とする機会が減っているということもありますが、個人的には今でも真面目に試験してみたらどうなんだ?と思うような状況に遭遇することがあります)
- 本質的には音声伝達は話者の言った意味(言語的な情報)が相手に伝わればよいのです. 極端な話、男声が女声に変わったり、他人にそっくりの声になったり、普通の声が泣き声になってもかまいません. 軍用の超低ビット・レートの音声伝送システムで似たような状況が生じることがありますが、「前進」という命令が「後退」に聞こえてしまうようなことが無ければ使用目的は満足されます.
2020.1.27 最新情報 : ディザ特性等の最適化
- 動作パラメーターの最適化はもうやることが無いと思っていたのですが、長時間実験をしているうちに適応フィルタのバイアス蓄積のメカニズムを今までよりは見通しよく理解できるようになり、ディザ特性やdecorrelatorの処理等に改善を加えました.
- 無理にバイアス蓄積をゼロに押さえ込もうとせず必要最小限の処理を組み合わせた方が、付加処理間の干渉や無駄な位相回転が小さくなり、全体として適応フィルタの収束特性が良くなりました. バイアス/歪には複数の発生要因があるため、そのすべてに完全な対策を取ることは不可能で、やろうとしてもペタペタ補助処理を付け加えているうちに逆に特性が低下しまうようです.
- 音質はすでに実用レベルに達しているので、耳で聞いてすぐ分かるような音質改善の効果はありませんでしたが、音響系のインパルス・レスポンス変動があった時の収束特性が向上しました.
- もともと再帰的なアルゴリズムを用いた適応フィルタを使ったシステムに、さらにフィードバックがかかっているために、微小なバイアス/歪が安定性に大きな影響を与えていることをあらためて確認することとなりました.
- バイアス蓄積の問題は、音響系のインパルス・レスポンスや暗騒音特性の変動等がある実環境でなければ把握出来ず、とにかく繰り返し長時間の実験をしなければならないのは大変です.
- decorrelatorの処理を改善してしばらくたってから気がついたのですが、低音域での周期性雑音入力に対する安定性が良くなったようです. 今までたまに冷蔵庫の中の棚板や上に置いた瓶が共振して発生した周期性雑音のために、適応フィルタの収束が不安定になることがあったのですが、いつの間にかそのような不具合が発生しなくなっていました.
- おそらくDecorrelatorの低域の特性が向上したためではないかと思われます.(処理遅延の制約のために、全帯域で理想的な特性を実現することは困難です)
2019.10.1 最新情報 : ハウリング・キャンセラLSIの概要
FIRフィルタ部分
LMSアルゴリズム部分
v[i] はES (Exponentially weighted Stepsize) アルゴリズムの演算用です
- 最初からセル使用率やタイミングを気にしながら手間をかけて作業をするをするつもりは無かったので、非常に余裕のある設計をしています.
- 演算はすべて浮動小数点演算です.(FPGA部分は単精度、ARMコアのソフト処理は一部倍精度演算)
- デュアルポート・メモリ(2P RAM)を活用した並列演算により、FIRフィルタ部分は動作クロック周波数200MHzで400MHz相当の演算性能を実現しています.
- LMSアルゴリズム部分も2P RAMを利用してクロック周波数200MHzで効率的な処理をしています.
- ユーザー指定の制約条件はピン配置、入出力の信号レベル、入力ピンのプルアップ、出力ピンのドライブ能力のみです.
クリティカル・パス指定その他のタイミング制約、クロック信号や配置配線に関する指定はまったくしていません. クロック信号はARMコア内蔵PLLで生成したものをFPGAのロジック部分で用いています.(ロジック部分の専用PLL、クロック専用信号ラインを用いる指定もしていません)
- セル使用率に余裕があり、動作周波数を控えめにした設計をしているので、これで何の問題も無く論理合成・配置配線が出来て、ちゃんと動作するLSIが完成します.
- 実際の設計に取り掛かる前にテスト回路を用いて浮動小数点演算器と2P RAMの配置配線後の最高動作周波数、動作タイミングの見積もりをおこなっていますが、本番の回路では配置配線後の詳細な遅延検証はおこなっていません. 統合化された設計ツールとHDLを用いたきちんとした同期式回路設計なので、設計レポートのセットアップ/ホールドのタイミング・マージンの項目を確認するだけで検証は十分です.
大真面目に400MHzあるいはそれを越えるクロック周波数でキチキチの回路設計をしたのでは、これほど簡単にデバイスを作ることは出来ません..
- FPGAなので特別な理由が無い限りは、量産時のテスト/選別用のテストパターンを作成する必要も無いので、とにかく気楽に設計が出来ます. セル使用率を気にしながら回路図入力で四苦八苦しながらゲートアレイを設計して、テスト/選別工程のトラブルに走り回っていた時代と比較すると夢のようです.
- FPGAメーカー(Xilinx)が提供しているオーディオ系の無償IPはいずれもストリームI/O向けでバッファリング処理の遅延がつくため、低遅延が要求されるハウリング・キャンセラには向きません. A/D・D/Aコンバータとのシリアルデータ伝送(I2S)用のインターフェース・モジュールは自作しました. 変換遅延等も含めたA/D・D/Aトータルの信号遅延は25サンプルです.(大部分はΔΣ型A/D・D/Aの変換遅延です)
- たいがいのFPGA評価ボード、DSP評価ボードにはオンボードのステレオ・オーディオ入出力がついていますが、あくまでもFPGA屋さん/プロセッサ屋さんが設計したボードなので、A/D・D/AコンバータICの性能を十分に引き出しているとは言えません.
- 以前、使用していたDSPボード搭載のオーディオA/D・D/Aでクロック信号の漏れに苦労したことがあります. どうやらUSB I/F用のクロックとA/D・D/A用のクロックの差信号成分が可聴帯域内に落ちてきていたようで、信号レベルは低いものの緩やかに周波数がドリフトするトーン信号の対処に苦労しました.
- 往々にしてこのようなトラブルが生じがちなので、A/D・D/AはFPGAボード外付けのものを用いています. シリアル伝送(I2S)の信号ラインへのダンピング抵抗挿入と、FPGA側のデータ出力信号とL/Rクロック信号の出力端子のドライブ能力を標準の12mAから4mAに変更するなどの対処をしてノイズを減らすことが出来ました.
- ダンピング抵抗挿入による波形整形の効果は低入力容量のアクティブ・プローブ(FETプローブ)が無いと測定困難なのですが、D/Aコンバータの出力信号のノイズ低減の効果はオシロスコープの観測波形を一目見て違いがはっきり分かります.
- 設計したハウリング・キャンセラLSIはARMコアによるソフト処理とFPGAロジック部分による適応フィルタを組み合わせて用いているので、ARMのソフトを入れ替えるだけで他にも面白い処理が出来ます. その一つが任意の広帯域信号を用いた残響特性測定・残響時間測定です.
- 音楽や暗騒音を音源に用いた残響測定の手法はいくつかあるのですが、実時間動作する適応フィルタを使うと残響特性の変化をリアルタイムに観察するのが容易です. 適切に収束速度(ステップサイズ・パラメータμ)を設定すれば、雑音の悪影響を軽減できます.
2019.5.23 出張デモ可能です
- 音響・信号処理関連の大学研究室等での適応ハウリング・キャンセラの出張デモが可能です.
お問い合わせは → TEL (042)357-0621
- 当社とは異なる様々な環境で実験、データ収集をさせていただけると非常にありがたいです.
ただし、現在のデモ機で対応可能なのは残響時間最大0.5秒程度の比較的デッドな部屋になります.(大きなホール、体育館等でのデモは不可能です)
2019.5.6 最新情報 : 周期性雑音の影響とラインノイズ・キャンセラの効果
- 適応フィルタを用いたハウリング・キャンセラはdecorrelatorの効果が十分ではないために、周期性雑音により収束特性が大きく乱されます. 具体的には、救急車のサイレンや電子アラーム/電子ブザー音、非常にスローテンポのピアノ曲などが入力されると、適応フィルタの収束が乱れて最悪の場合は動作を停止してしまいます.(浮動小数点演算でもオーバーフローが発生します)
音声入力時には周期性雑音が重畳しても問題は無いのですが、無信号時(室内の暗騒音のみ入力時)に遠くから救急車のサイレン音が聞こえてくると突然ハウリング・キャンセラの動作が不安定になって異音が発生するという困った現象が発生します.
- 処理遅延増大や音質低下という実用上許容しがたいペナルティがつくので、decorrelatorの処理性能向上は極めて困難です. そこで周期性雑音を抑圧するために適応フィルタを用いたラインノイズ・キャンセラを組み込みました.(ハウリング・キャンセラ本体の適応フィルタとは別です)
ラインノイズ・キャンセラは通常の音声入力時には動作しないので、拡声音の音質に与える悪影響はありません.
- オフラインのシミュレーション結果を以下に示します. プログラムはDSPを用いたデモ機のものと同一で、デモ機で実験をおこなっているダイニング・キッチンの音響系のインパルス・レスポンスの実測データを用いてシミュレーションしています. 周期性雑音には救急車のサイレン音を用いています. 室内の暗騒音を模擬するために、低域強調特性のランダムノイズも付加しています.
- ランノイズ・キャンセラ無しのシミュレーション結果から、周期性雑音が適応フィルタの収束特性に与える悪影響が良く分かると思います.
- シミュレーション結果を詳細に周波数分析すると、低音域でかなり周波数偏移の大きい変調(±10Hz以上)がかかっているかのように見えますが、このように極端な変調処理は用いていません. 周波数特性が平坦な雑音入力時にのみ発生する現象で、音声入力時には観測されません. 詳細な原因は不明ですが、定常な白色雑音入力時には補助処理の位相回転・特性変動等の影響による周波数特性の揺らぎが顕著に現れるようです.
2019.5.4 最新情報 : LSIのソフト処理部分最適化完了
- ハードウェア化/LSI化に向けたソフト処理部分の最適化を完了しました.
- ハードウェア化は適応フィルタのタップ長増大により、残響時間2秒の環境にも対応するのが目標です. ARMプロセッサのハードマクロ内蔵FPGAを用いて、ソフトウェア処理とハードウェア処理を組み合わせる予定です.
- 今までサンプリング周期と非同期に実行していた複数の補助処理を整理して、FPGA内蔵のARMプロセッサでの処理に適した形にしました. 適応フィルタの演算はFPGAのロジック部分で実行する予定です.
- 同時に細かい安定性向上・音質向上のための処理構成の見直し、パラメータの再最適化をおこない、もうこれで限界だと思っていた各種特性も良くなりました.
- DC端、fs/2端の収束特性は下図のような理想的特性が得られています. 低域が強調されたロックの曲を室内で再生しても、DC端、fs/2端の収束特性は安定しています.
- 衝撃音入力時の安定性も向上したために、衝撃音対策のコンプレッサ処理を削除できました. マイクの近くでクシャミをしたり、手をたたいたり、空き缶を叩いたりしても安定です. 衝撃音の信号レベルが極端に大きい場合は歪が生じるものの、適応フィルタの動作の安定性が崩れることはありません.
- 周期性の強いトーン信号(電子ブザー音、救急車のサイレン、非常にスローテンポのピアノ曲etc)入力時の安定性も改善出来ました. ハウリング抑圧用とは別の適応フィルタを用いて周期性信号を抑圧しています. トーン信号の継続時間が長い時だけ動作するので、音声入力時の音質に与える悪影響はありません. あくまでも継続時間の長い周期性信号によって適応フィルタの収束が乱されて異音が発生することを防止するための処理です.(原理的に周期性信号に対してはdecorrelatorの効果が著しく低下します)
- 音響学の一般常識に反して、適応フィルタを用いたハウリング・キャンセラは残響時間が短い環境の方が動作条件としては厳しくなります. ハードウェア化/LSI化しても残響時間の長いホールで実験したらうまく動かないかもしれない~などという心配をする必要はありません. 今まで、ダイニング・キッチンでテストしていたデモ機をより残響の長い会議室等に持っていって実験した時に、動作特性が低下したことは一度もありません.
- 適応フィルタのタップ長は残響時間の1/2相当で十分です. サンプリング周波数8kHzなので、残響時間2秒に対応するには1秒分、8000tapで良いことになります. 残響測定において実測可能なのは
-20dB~-30dB程度までの減衰特性で、測定データからの外挿により -60dBで定義されている残響時間を求めているという事実と符合します.
- 丸め処理を挿入して適応フィルタの係数更新処理部分の仮数部の精度を5bit相当(5bit x 6dB = 30dB)に落としてもハウリング抑圧は可能です. したがって16bitの固定小数点演算でも問題は無いはずなのですが、各種補助処理の都合等から浮動小数点演算を用いざるをえません. 一部は演算精度の点から倍精度浮動小数点演算を用いています. ハードウェア化/LSI化する場合、今時のデバイスはゲート/シリコンが有り余っているので、浮動小数点演算でどんなに下手な回路設計をしても1チップに納まらなくなる心配はありません.
- 周波数4kHz以上の周波数帯域は、帯域分割してハウリング・キャンセラとは別に処理します. 適切な指向特性のスピーカー・システムを用いればマイク位置での周波数特性は高域が低下するので、4kHz以上で適応フィルタにより処理する必要のあるハウリングが発生することはありません.
- 余談ですが、室内音響設計において設計対象となる周波数帯域の上限も実はたかだか4kHz程度です. 温度/湿度の変化や、室内にいる人の数や着衣の違い等による音響系の特性の変動が大きくなるため、4kHz以上の周波数で厳密な音響設計をすることは不可能です. 音響学の専門家にとってはハイレゾ・オーディオは冗談でしかありません.
ハウリング・キャンセラの適応フィルタ係数とフーリエ変換して求めた周波数特性(起動後14時間経過)
DC端、fs/2端の収束は理想的な特性を示している.
ハウリング・キャンセラの適応フィルタ係数とフーリエ変換して求めた周波数特性(起動後36時間経過)
丸一日以上の連続運転でも収束は安定しています.
2018.8.15 最新情報 : パラメータ再々々々調整の結果
- 収束特性向上はもうこれが限界と思っていたのですが、少し気になっていた点を調べているうちにさらに最適な補助処理の構成、パラメータ設定が分かりました. 入力信号の周波数特性補正処理(時変処理)をおこなっているのにもかかわらず、暗騒音特性の変動により微妙に適応フィルタの収束特性が変化するのが不思議だったのですが、ちゃんとした対策が出来ました. 改良によりエアコンや冷蔵庫のコンプレッサのオン/オフによる騒音変化、少し離れたところにある幹線道路からの自動車騒音の変動の影響を軽減して安定した収束特性が得られます. 補助処理を整理して演算量にも少し余裕が出来ました.
- 余談ですが、窓を開けて夜間に実験していると、ハウリング・キャンセラの特性変動から近くの交通信号の点灯周期が2分であることが、はっきり分かります.
- 適応フィルタのバイアス蓄積の問題はまったくありません. 今まで何年間も対策に苦労していたのが嘘のようです.
- 最適化をおこなった結果を下図に示します.(4時間経過後の適応フィルタ係数と周波数特性)
低音域の収束特性が改善したのは、スピーカーの配置を変更した影響もあります. 今までは拡声用のスピーカーを別のスピーカーの上に置いて実験していましたが、ちゃんとしたスタンドに乗せて床や壁から少し離して配置しました.(下に置いた別のスピーカーの振動板の共振・再放射の悪影響が無くなりました)
- ようやく100%の安定動作の確証が得られましたので、ハードウェア化(LSI化)の作業に入れます. 今のFPGAはミドル・レンジのデバイスでもかなりの数の浮動小数点積和演算器を搭載することが可能なので、余裕で1チップ化出来ます. すこし設計は面倒になりますが、制御用にハードマクロのプロセッサ(ARMコア)を使用することを検討しています.
2018.4.30 最新情報 : パラメータ再々々調整の結果
- さらに細かい改良・改善・パラメータ最適化をおこなった結果を下図に示します.(18時間経過後の適応フィルタ係数と周波数特性)
おもな変更箇所は下記のとうりです.
- 新たな decorrelator の処理追加. decorrelator 追加により処理遅延が増えましたが、それでもA/D・D/Aの変換遅延27samplesを含めて、40samples以内の遅延におさまっています.(サンプリング周波数8kHz) 若干エコーもつきますが、残響のある部屋では普通の人は気づかない程度です. 低音域の安定性・拡声音の音質がさらに向上しました. 「ハウリング・キャンセラで複雑な処理をしているので、どうしても音質劣化があります」という
excuse をつける必要はありません.
長時間動作でもバイアス蓄積が無いことを100%保障できるようになったので、改良・改善の実験が非常に楽になりました. バイアス蓄積が無いことを確認するための数時間以上にわたる実験継続は不要です.
- 衝撃音入力時の安定性向上のためのコンプレッサ追加. 入力音声のダイナミックレンジ圧縮に用いる常時動作のコンプレッサでは無いので、拡声音質の劣化はありません.(過大衝撃音入力時のみ動作) 処理遅延の増加もありません.
マイクのすぐ近くでクシャミをしたり、手を叩いても安定です.
- dither付加処理の最適化. 細かいミスがあったのを修正しました.
- 演算量がDSPの処理能力いっぱいになってしまったので、これ以上の改良はもう無理のようです. 音質向上もこれが限界です. 低音域の安定性が改善され、いわゆるブーミー感も無くなったので、主観的には以前より低音不足ぎみに感じられるくらいです. そのため音声帯域外成分除去用のHPFのカットオフ周波数を少し下げました.(fc=270Hz
→ 250Hz)
2018.2.2 最新情報 : パラメータ再々調整の結果
- 特性可変dither付加処理の構成、パラメータをさらに最適化した結果を下図に示します.(5時間経過後の適応フィルタ係数と周波数特性)
DC端、fs/2端ともに非常に素直な減衰特性を示しています. バイアス蓄積は完全に抑えられています.
- 音質改善、衝撃音対策のためのパラメータ調整で再発した長時間の安定性の問題はこれで完全に解消されました.
2018.1.24 最新情報 : パラメータ再調整の結果
- 2016年末にAES (Audio Engineering Society) 日本支部の例会でデモをさせてもらった時に、最後の拍手でハウリング・キャンセラの動作が不安定になるというトラブルが生じました. マイクのそばで手を叩いたぐらいでは動作に問題無いことを確認していたのですが、大勢の方からの拍手でおかしくなってしまいました.
- このような連続的な衝撃音入力に対する安定性向上と、拡声音の更なる品位改善のための動作パラメータ再調整、処理構成の見直しをおこなっていましたが、ようやく作業が完了しました. 衝撃音対策と音質改善は比較的素直に出来たものの、長時間の動作の安定性の問題(バイアス蓄積)が再発したために、再調整には非常に苦労しました.
- 以前はグラフィック・イコライザで音響系の周波数特性を平坦化して、意図的にハウリングの発生しやすい厳しい条件で実験をおこなっていました. 現在は下図のように、スピーカーの側面にマイクを配置し、グラフィック・イコライザによる補正無しという現実的な条件設定でテストをしています.
- パラメータ再調整後の適応フィルタ特性(フィルタ係数と周波数特性)は下記のとおりです.(15時間経過後)
DC端、fs/2端ともに利得が素直に減衰していて、適応フィルタのバイアス/歪の蓄積が無いことが分かります. 以前よりもfs/2端の利得の減衰量が少なめですが、fs/2端ぎりぎりの周波数成分を減衰させるための補助フィルタ(LPF)の次数を下げたのが原因です.(適応フィルタの動作に悪影響はありません)
decorrelator の効果が得られにくいDC端で再発したバイアス蓄積対策には苦労しましたが、最終的には新たに追加したdecorrelatorと微少量のdither付加により問題を解決することが出来ました.
- パラメータ設定が最適化されていない状態での収束特性をいくつか下記に示します.(それぞれ別々のパラメータ設定での実験結果)
パラメータ最適化後と比較してすぐに分かる相違点は、音声帯域外の低域・DC端の減衰量が少ないことですが、単に減衰量が問題なのではありません. 問題は収束の安定性を保証できないことにあります. 一見、安定しているかのように見えても、数時間あるいは10時間以上経過してからバイアスの蓄積が始まってDC端の利得が徐々に増大するという現象が発生することがあるのが厄介なところです.
商品化するにあたってはどのような使用条件でも24時間、あるいは最低でも8時間以上の動作の安定性を確保する必要がありますが、これでは動作の安定性に確信が持てません.
- 動作パラメータの最適化と同時に、入力信号の周波数特性変動とレベル変動に対応した、特性可変のdither付加をおこなっているので、現在は入力音声や暗騒音が変化しても適応フィルタの収束の安定性を保つことが可能です.
- 音声入力無し、すわち暗騒音が入力での長時間動作の安定性は実用上大した問題では無いと思われるかもしれませんが、実は拡声音の音質と密接な関係があります. 信号レベルの小さい暗騒音でバイアスが蓄積するということは、音声入力時の適応フィルタの動作の擾乱も大きいのです. 丹念にバイアス蓄積、長時間動作の安定性の対策をすると、拡声音の音質も顕著に向上します. 特に低音域のブーミー感・強調感が解消されて、ソリッドな音質になります.
プレスリリース : 従来技術・従来製品の性能の限界を超える高性能ハウリング・キャンセラの開発に成功 はこちらのページです. (Press Release in Japanese)
適応フィルタを用いたハウリング・キャンセラ実用化に関する、すべての技術的問題点を解決しました.
音質、動作の安定性の問題も解消済みです.
ハウリング・キャンセラなし/ありの比較実験結果
- デモ機を用いたハウリング・キャンセラなし/ありの比較実験結果を以下に示します.
- 実験したのはふつうの作りのダイニング・キッチンで、マイク/スピーカ間の距離は2.5mです.
- グラフは拡声装置のマイクロホンの出力信号を録音したものです. デモ機の低音処理部の処理対象である4kHz以下を録音し(サンプリング周波数8kHz)、室内の暗騒音除去のためにHPF(fc=150Hz)をかけてあります.
- 15秒間隔で、拡声装置の利得を徐々に上げています. 0~15秒間は利得-3dB、15~30秒間は0dB、30~45秒間は3dB、45~60秒間は6dB、60~75秒間は9dBです.
- ハウリング・キャンセラなしでは、利得0dBで若干拡声音が不安定になり、利得が3dBを超えるとハウリングが発生します.
- ハウリング・キャンセラありでは、利得9dBでも完全にハウリングが抑圧されています. ハウリング・キャンセラありの拡声音を聞いてみると、利得3dBと6dBでは少し音質の劣化したキンキン声になっていますが、これは利得-3dB/0dBでの動作中に適応フィルタの特性が乱れてしまったためです.(適応フィルタの動作パラメータは利得6dBの状態に合わせ込んであります) 時間がたつにつれ徐々に収束が進んで、良好な音質になっています.
ハウリング・キャンセラのデモ機
- 低音処理部と高音処理部の2ブロック構成
- 周波数帯域 200Hz~16kHz(低音処理部+高音処理部)
- 低音処理部サンプリング周波数 8kHz
- 低音処理部適応フィルタ・タップ長 1600タップ(0.2秒分)
グラフィック・イコライザは拡声システムの周波数特性を平坦化するためのものです. 写真を見てわかるとおり、低音域を持ち上げて200Hz以下まで平坦な特性に補正しています.
ノートパソコンの画面に表示されているのは、低音処理部(サンプリング周波数8kHz)の適応フィルタのフィルタ係数とそれをフーリエ変換した周波数特性です.
下図は8時間以上連続稼動後のデータですが、適応フィルタのバイアス蓄積による収束特性の異常はありません.
拡声システムの利得は最大8dBに設定していますが、安定性向上のために付加した変調処理による位相回転等の影響により、適応フィルタの利得の最大値は10dB近くになっています.
適応フィルタ係数のグラフの頭の部分の小さなピークは、A/D・D/A変換回路のクロストークの影響です.
下図は実験終了後に、TSP (Time Stretched Pulse) を用いて測定した拡声システムの周波数特性です
- お知らせ
科学・技術系マスコミ向けデモ、取材対応について
- 科学・技術系マスコミの方向けのハウリング・キャンセラのデモ、取材対応が可能です. 持参したデモ機(詳細はこのページの下を参照)とスピーカー、アンプ等を用いて事務所、会議室などで、ハウリング・キャンセラ付きの拡声装置のデモ/実演が可能です. スピーカー、アンプも含め、必用な機材すべてを持ち込み可能です.(AC100V電源があればO.K.)
- ただし極端に残響の大きい、普通に会話をしていても違和感を感じるような音響設計の良くない会議室では拡声音の音質が低下しますので、ご了承ください.(低域がボンボンする、いわゆブーミーな音になります)
- 詳細は当社までお問い合わせください.→ TEL (042)357-0621 E-mail dsp@cepstrum.co.jp
- AES(Audio Engineering Society)日本支部2016年12月例会での発表/デモの実績があります.
- 当社のハウリング・キャンセラは過去50年間のハウリング抑圧研究の歴史(PDFへのリンク)をくつがえす、世界初・世界一の画期的新技術です. 拡散音場において現実的な条件下でのハウリング抑圧に成功した他の研究者は存在しません.(注:ここで言っている「拡散音場」とは、音響学の理論的概念のことではなく、無響室ではない残響の存在する普通の部屋という意味です)
- 上記リンク先の論文(総説)の中のFig.11(下図左)には誤りがあります. 実際の拡声システムの構成は下右の図のようになり、ゲイン・ブロックGの位置が異なります. 何故このような誤りが生じるのかというと、適応フィルタを用いたハウリング・キャンセラ付きの拡声システムのフィードバック・パス(Feedback
Path)とフォワード・パス(Forward Path)の位置を取り違えているからです.
Left : Error in Fifty Years of Acoustic Feedback Control: State of the Art and Future Challenges
Right : Correct Block Diagram
ハウリング・キャンセラ実験キット
- ハウリング・キャンセラ実験キットCANCELLER KITを使って、どなたでも手軽にハウリング抑圧手法の実験、技術習得、デモンストレーションが出来ます.
- 当社出荷価格は220万円(税込237万6千円)です. 製品の詳細は当社までお問い合わせ下さい → TEL (042)357-0621
アカデミック・ディスカウント価格に関しても当社まで直接お問い合わせ下さい.(大幅なディスカウントを適用可能です)
- なお、実験キットは当社の所有する知的財産権・工業所有権を販売、譲渡、ライセンスするものではありません.
ハウリング・キャンセラ実験ソフトウェア/ライブラリ
- ハウリング・キャンセラ実験ソフトウェア/ライブラリCANCELLER SOFT/FAST DSP LIBはハウリング・キャンセラ実験キットCANCELLER KITに含まれているソフトウェア、プログラミング・ライブラリのみを単体販売するものです. ハウリング・キャンセラの実験に必用なハードウェア(DSPボード、マイク、スピーカ、アンプetc)はお客様にてご用意いただく必要があります.
必用なDSPボードはTI(Texas Instruments)社製の C6713 DSK です. 国内販売価格は5万円前後です.
- 当社出荷価格は45万円(税込48万6千円)、教育機関向けのアカデミック・ディスカウント価格は18万円(税込19万4400円)です.
製品の詳細は当社までお問い合わせ下さい → TEL (042)357-0621
- なお、本製品は当社の所有する知的財産権・工業所有権を販売、譲渡、ライセンスするものではありません.
- C6713 DSK付属の開発環境 CCS (Code Composer Studio) Ver.3 はWindows2000/XP対応ですが、フリーで入手可能な
CCS Ver.6 を用いれば、Windows10やWindows7でも使用可能です. 詳細はこちらのページをご覧ください.
- 大学、高専でのハウリング・キャンセラの実験/追試には廉価な CANCELLER SOFT/FAST DSP LIB (税込19万4400円)をご利用ください. DSP評価ボード
C6713 DSK はすでにお持ちの研究室が多いと思いますので、ぜひ C6713 DSK を有効活用してください.
他に必用なアンプ、マイク、スピーカー等の機材は市販の一般的な仕様のもので大丈夫です.
- C6713 DSK 以外の機材の一例を下記に示します.
- マイク
- AT9904 (オーディオテクニカ)
タイピン型の無指向性マイクロホンです
- マイクアンプ
- AT-MA2 (オーディオテクニカ)
C6713 DSK にはマイク入力端子がありますが、レベル調整のしやすさなどから外付けのマイクアンプを使用することをお勧めします
マイクアンプは C6713 DSK のライン入力端子に接続して使用してください
- パワーアンプ内蔵スピーカー
- VL-S3 (TASCAM/ティアック)
取り扱いに便利な小型の製品です
- ハウリング抑圧に関する参考文献(年代順)-詳細な書誌情報はリンク先をご覧ください(IEEE Explore、CiNii、J-GLOBALの該当ページへのリンクです)
- 2016.4.15 効果の分かりやすいハウリング・キャンセラのデモ
- 3秒間の遅延を付加してあるのでハウリング・キャンセラの効果が良く分かります. 拡声音は3秒遅れて出てきます.
- YouTube動画はデジカメを使って録画・録音していますが、録音には8bit A/Dのデジカメ内蔵マイクを使っているので音質は良くありません.
- wavファイルはパソコンと外付けマイクで録音しています. ノイズ除去のためにHPF(fc=250Hz)を通してあります.
- ハウリングキャンセラ無しの拡声装置のデモ(3秒遅延付加)
- ハウリングキャンセラ・デモ(3秒遅延付加)
- 2016.3.9 ハウリング・キャンセラのデモ機(1号機)のハードウェア
- ハウリング・キャンセラのデモ機(1号機)には Texas Instrumets (TI) のDSP評価ボード C6713 DSK を使用しています. DSPの演算能力とオンボードのA/D・D/Aコンバータの性能の制約で、サンプリング周波数8kHzで処理をおこなっています. 周波数4kHz以上でハウリングが発生することはまず無いので、評価/デモの用途に問題はありません. 一般の拡声装置でハウリングが生じたときのキーンという(4kHzを超える)高音はクリップした高調波成分で、発振条件を満たしたのはもっと低い周波数です.
- C6713 DSK はプロセッサ・ボード屋さんが作ったデジ/アナ混載基板なので、A/D・D/A回路のS/N等の性能はほどほどという程度ですが、とりあえずは使い物になっています. 逆に言えば、ハウリング・キャンセラに特別高性能のA/D・D/Aは必用とされないということです.(もちろんS/Nはできる限り良いほうがベターですが)
- DSKには機能拡張用の子ボードを載せて、シリアル出力をBluetoothでパソコンに飛ばしています.(USB経由の有線出力も可能)
- 2016.3.9 ハウリング・キャンセラ用のマイクロホン
- ハウリング・キャンセラ用のマイクロホン・アレイに関して検討・実験をおこなったのですが、残念ながらマイクの指向特性の制御による性能向上は限定的です. TV会議システムなどで効果を発揮する近接音場向けの鋭いヌル特性を有する減算型のアレイは、拡声系のハウリング・キャンセラにはあまり適していないようです.
- 下の写真の右端の蜂の巣状にエレクトレット・コンデンサ・マイク素子7ヶを並べたマイクは、マイク素子内蔵のアンプ(インピーダンス変換器)のノイズ低減を目的としたものです. 並列接続でランダム・ノイズが減って、S/Nが
20*log10(sqrt(7))=8.45[dB]
向上します.
4kHz以下ではほとんど無指向性のはずなのですが、実験をしてみると筐体の回折特性の影響が意外なほど顕著にあらわれます. 縮小模型実験やマイクを複数組み合わせたインテンシティ計測には小型のマイク(径の小さいプローブ・マイク)を用いなければならないということが実感できました.
- 2015.11.18 ハウリング・キャンセラ実験ソフトウェア/ライブラリCANCELLER SOFT/LIBの販売開始
- 2015.5.26 ハウリング・キャンセラのデモ
- 5月25日に某国立大学の音響関係の学科でハウリング・キャンセラのデモをさせてもらいました. 先生方と学生さんから貴重なご意見をいただきました.
- 社内の実験では、どうしても不自然な変調がかかってしまうために生ずる拡声音の「揺れ」、「にごり」を気にしていたのですが、意外にも音質の不自然さや歪に関するご意見はありませんでした. それよりも現在のデモ機に使っているDSPボード、A/D・D/Aボードの性能に起因する周波数帯域幅の狭さ(サンプリング周波数8kHz)や残留雑音(S/N)が気になるという指摘がありました. 次のデモ機(2号機)ではこの点は改良する予定です.
- こちらから持ち込んだ実験機材の背後に見えている小型スピーカー群は22.2chサラウンドの実験用だそうです.
- 2015.1.27 ハウリング・キャンセラを用いたDAF(Delayed Auditory Feedback)のデモンストレーション
- 音は目で見えないのでweb上でハウリング・キャンセラの実演は出来ません. 代わりに、ハウリング・キャンセラの効果が比較的分かり易いDAF(Delayed
Auditory Feedback)のデモの様子を録画しましたのでご覧ください.
DAFデモ動画 daf_demo.flv (4800KB) daf_demo.wmv (6300KB)
- システムの構成は下図のとうりです. 通常のハウリング・キャンセラ付きの拡声システムに200msのディレイを追加しています.(正確にはソフト的に実現したディレイがハウリング・キャンセラの中に組み込まれています) 拡声システムの利得は最大6dBです. 当然ですが人が喋った声(直接音)よりも、ディレイを経由したスピーカー出力のレベルの方が大きくなります. ハウリング・キャンセラが無ければハウリングが発生するので実験になりません.
- 適応フィルタのタップ長がかなり長めで、ステップサイズ・パラメータμの値も適切でなかったために、単純遅延ではなく深いリバーブがかかっています. DAFによる発話阻害は個人差が大きいのですが、特に問題無く普通に喋れてしまいました. 遅延成分のレベルがまだまだ小さめだったせいもあると思われます.(通常は聴覚的なフィードバックがうまくかからないように、ヘッドホンをつけてかなりの大音量で実験をします)
- 2015.2.6 (注)
- 上記のDAFのデモは、ハウリング・キャンセラを全二重通信システムに適用したときにどうなるか~ということを示しています. ハウリングは完全に抑圧可能ですが、多かれ少なかれエコーが残ります. DAFデモではパソコンのモニターに表示されたテキストを読み上げているのでエコー(リバーブ)がかかっていても発声出来ましたが、通常の会話ではその限りではありません.(個人差もあります)
- ある意味、エコー・キャンセラーよりハウリング・キャンセラの方が技術的に容易と言うことが出来ます. エコーキャンセラは20dB~30dB、場合によっては40dB程度のエコー抑圧性能が必要となりますが、ハウリング・キャンセラはたかだか6dB~10dB前後の過剰ゲインを抑圧できれば問題ありません.
- ある程度のエコーが残るので、伝播遅延や音声圧縮伸張の処理遅延の大きい全二重通信システムには現状のハウリング・キャンセラの適用が困難です. 遅延を無視できる有線通信(例えばインターホン)ならば、ボイス・スイッチなどを用いずに、まったく途切れなく通話出来る完全な全二重ハンズフリー通信システムを実現可能です. 音声非圧縮の見通し線内全二重無線通信システムにも適用可能です.
- なお、ハウリング・キャンセラを一般的な構成の拡声システムに適用した場合、エコー付加は問題となりません. 人間の耳では部屋の残響と(遅延の短い)エコーの区別がつかないので、見かけ上の拡声システムの利得増大の効果が得られます.
- 2014.10.20
- 日経BP社の日経エレクトロニクス誌 2014年10月13日号に名古屋工業大学(大学院 市村・加藤研)によるアナログ回路を用いたハウリング除去手法の記事「ハウリングを高速応答のアナログ回路で除去」が掲載されていました.(研究室のPDF資料へのリンク) 当社のハウリング抑圧手法と名古屋工業大学の手法を比較すると、下記のようになります. 結論のみを述べると、名古屋工業大学の手法は当社のハウリング・キャンセラとの比較の対象にならない~といわざるを得ません.
- 名古屋工業大学のハウリング除去手法は、原理的には適応ノッチフィルタを用いたものと等価です. ハウリングの発生する周波数が限られている場合は有効に機能します.
- 音響系のインパルス・レスポンスを、CRネットワークを用いた単純な位相シフト回路(時定数16μs)でモデル化してシミュレーションをされているようですが、現実の拡声システムでは音速が遅いために、電気系と比較して極めて大きな位相回転が音響系で発生します. さらに残響のために位相特性は大きく乱れ、変動します. 本当にハウリングを抑圧出来るかどうかは、残響のある部屋で実験をしなければ実証不可能です.(少なくとも無響室や残響の少ない防音室での実験は必要です) 現実的な環境で本当にハウリング抑圧が可能であることを確認できなければ、当社のハウリング・キャンセラとの比較も出来ません. シミュレーションだけなら良く働くハウリング抑圧手法は他にもあります.
- ハウリング抑圧に限らず、様々な音場制御技術の難しいところは、室内には残響があることです. 電気系の技術者の方に分かりやすく例え話をすると、残響のある部屋は無線屋さんなどにとっては想像を絶するような「超々マルチパス環境」なのです. だからシミュレーションや無響室での実験がうまくいったと主張しても、残響のある部屋での実験結果が無ければ、音響の専門家はそれは話半分以下であるとしか認めてくれません. 無線屋さんがRAKE受信方式などで想定しているマルチパス環境など、音響屋にとっては(音波を反射してしまう)機材を持ち込みすぎた無響室内の環境程度であって、その状態を残響があるなどとは言いません.
- 参考までに当社がいつも実験に使用している部屋に設置した拡声システムのインパルス・レスポンスの一例を下図に示します.(利得は最大6dB) 時間軸の単位はミリセカンド(ms)で、インパルス・レスポンスの継続時間は軽く50msを越えることにご注意ください. 室内にいる人(吸音体)が移動したり、室温が変化したり、空調で温度分布が変化したりしても、インパルス・レスポンスは変動します.(音響系のインパルス・レスポンスは常に変動しています) 広いホールなどでは、インパルス・レスポンスはもっと長大になります.
インパルス・レスポンス・データファイル(サンプリング周波数8KHz) room_impulse_response.txt (26KB)
- ハウリングキャンセラのシミュレーション・プログラム
- 2009年9月11~12日の東京都立産業技術研究センター西が丘本部の施設公開で当社の改良手法を用いたハウリングキャンセラのデモが実施されました.
- マイクとスピーカの間隔は数cm程度です. 超大型(!?)のオープン・フィッティング型の補聴器のモデルになっています.
- マイク/スピーカのそばで小声で喋ると、スピーカから自分の声が大きく増幅されて聞こえてきます.
- システムの開ループ利得は周波数1kHzで20dBです.(ハウリングキャンセラが無ければすぐに発振します)
- ハウリングの性質
- 拡声装置,補聴器等のハウリングは,音響的な正のフィードバックによりその伝達特性が発振条件を満たした時に発生します. 下図において拡声システム(電気系)の伝達特性をHE(ω),音響系の伝達特性をHA(ω)とすると,以下の2つの条件をともに満たした周波数ωでハウリングが生じます.
条件A 開ループ利得が1を超える 1 < |HE(ω)HA(ω)|
条件B 位相回転が2π(360度)の整数倍になる ∠ HE(ω)HA(ω) = 2nπ
- 一般的な拡声装置ではスピーカとマイク間の距離が大きく,電気信号と比較して音波の伝播速度が遅いために音響系での位相回転が大きくなります. したがって,利得が過剰な場合にはあらゆる周波数でハウリング(発振現象)が生ずる可能性があります.
- 発振条件が満たされれば,マイクに音声を入力しなくても室内の暗騒音やアンプの内部雑音を励振信号としてハウリングが発生します. 実際に無響室内で観測したハウリング音の波形を以下に示します. (a)が波形,(b)がそのスペクトログラムです.
- ハウリングの振幅ははじめ指数関数的に関数的に増大しますが無限大に発散はせず,やがて振幅一定の定常状態(飽和状態)に達します.
- システムの開ループ利得 |HE(ω)HA(ω)| は周波数約800Hzでわずかに0dBを超える程度なので,ハウリング音の立ち上がり部分は周波数約800Hzの正弦波です. しかし,飽和状態では波形がクリップして整数倍の周波数の歪成分が発生しています.
- ハウリングが飽和する原因は拡声システムが飽和特性(非線形性)を有しているからです. マイクの振動膜,スピーカのボイスコイルとコーン紙の変位量は有限であり,アンプの電源電圧も有限です. したがって,拡声システムは本質的に有限振幅特性を有しています.
- 現実の拡声システムでは観測困難ですが,(非線形特性を組み込んだ)コンピュータ・シミュレーションでは,条件設定によっては下図のような特異なハウリング波形が発生することがあります. このような波形でも定常状態で振幅が飽和することは変わりありません.
かなり恣意的な伝達特性の設定でシミュレーションをすると,下図のように定常状態に達するまでにさらに波形が変動する場合があります.
-
ご興味のある方は下記のScilabのシミュレーション・プログラムを試してみてください. 動作確認はScilab4.1.2でおこなっています. 下記の拡張子sceのファイルはScilabのソース・プログラムですので,実行にはScilabのシステム本体をパソコンにインストールする必要があります.
howling_sim001.sce
波形スペクトログラム
howling_sim002.sce
波形スペクトログラム
howling_sim003.sce
波形スペクトログラム
シミュレーション・プログラムの処理の概略は下図のようになっています. FIRフィルタとリミッタ回路を組み合わせてフィードバックをかけているだけです. exitation
signalはハウリングを起こすための励振信号です.
- ハウリングキャンセラ無しの拡声システムの性質
- 最初の図に戻ると,ハウリングキャンセラ無しの拡声システムでハウリングが発生する原因はスピーカ~マイク間の音響系の結合(フィードバック)が生じるからです. スピーカとマイクの距離は大きいほうがハウリングは発生しにくくなります.(
|HA(ω)| をできる限り小さくする) スピーカ~マイク間の音響信号の伝達を遮断すればハウリングは発生しません. フィードバック・パスを切断すると
|HA(ω)| =0 となります.
- ハウリングキャンセラ付きの拡声システムの性質