研究生: |
梁翰銘 Liang, Hang-Ming |
---|---|
論文名稱: |
利用粒子濾波器與麥克風陣列進行直角座標上多聲源之追蹤 Multiple Sound Source Tracking Using Microphone Arrays and Particle Filter |
指導教授: |
劉奕汶
Liu, Yi-Wen |
口試委員: |
白明憲
王小川 |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
論文出版年: | 2012 |
畢業學年度: | 101 |
語文別: | 中文 |
論文頁數: | 50 |
中文關鍵詞: | 聲源定位 、聲源追蹤 |
外文關鍵詞: | sound source localization, sound source tracking |
相關次數: | 點閱:2 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
傳統聲源定位的方法大多利用當下時刻麥克風陣列所收到的資訊來計算聲源位置;但由於聲源位置估計可能因迴響而造成定位劇烈誤差,故本論文以聲源到達兩相鄰麥克風之間的相對時間延遲(TDOA,Time duration of arrival)為基礎,利用粒子濾波器(Particle Filter)對聲源做追蹤以避免定位誤差的產生。但由於聲源追蹤仍存在著無法追蹤非單一非連續聲源的狀況,故本論文提出了一個架構,針對粒子濾波器無法追蹤非單一連續出聲聲源的狀況做改善,藉此完成一個相對可靠的多聲源的聲源追蹤定位系統。
本論文所提出的架構共分成兩個主要的部份,第一個部分提出了聲源追蹤的重置機制,利用這個重製的機制我們可以避免掉追蹤物不存在的狀況;第二個部分為聲源數的即時確認機制,本論文以不同的位置有不同的聲源及不同的聲源具有不同的內容為假設,利用聲源萃取來分離聲源,並以分離出來的聲源提出一個聲源數目確認的機制,利用這個機制我們可以即時的確認聲源數目,解決因聲源數目未知所產生的定位誤差,最後經由實驗證實本論文所提出的兩項機制確實能夠解決傳統聲源追蹤輔助定位會發生的困難,並減少因空間迴響所造成的定位誤差。
1. Nakadai, K., et al. Applying scattering theory to robot audition system: robust sound source localization and extraction. in Intelligent Robots and Systems, 2003. (IROS 2003). Proceedings. 2003 IEEE/RSJ International Conference on. 2003.
2. Valin, J.M., J. Rouat, and F. Michaud. Enhanced robot audition based on microphone array source separation with post-filter. in Intelligent Robots and Systems, 2004. (IROS 2004). Proceedings. 2004 IEEE/RSJ International Conference on. 2004.
3. Vermaak, J. and A. Blake. Nonlinear filtering for speaker tracking in noisy and reverberant environments. in Acoustics, Speech, and Signal Processing, 2001. Proceedings. (ICASSP '01). 2001 IEEE International Conference on. 2001.
4. Liang, Z., X. Ma, and X. Dai, Robust tracking of moving sound source using scaled unscented particle filter. Applied Acoustics, 2008. 69(8): p. 673-680.
5. Ward, D.B., E.A. Lehmann, and R.C. Williamson, Particle filtering algorithms for tracking an acoustic source in a reverberant environment. Speech and Audio Processing, IEEE Transactions on, 2003. 11(6): p. 826-836.
6. Valin, J.M., et al. Robust sound source localization using a microphone array on a mobile robot. in Intelligent Robots and Systems, 2003. (IROS 2003). Proceedings. 2003 IEEE/RSJ International Conference on. 2003.
7. 楊善翔, 聲源三維方位偵測之研究, in 資訊工程系2009, 國立臺灣科技大學: 台北市. p. 78.
8. Knapp, C. and G. Carter, The generalized correlation method for estimation of time delay. Acoustics, Speech and Signal Processing, IEEE Transactions on, 1976. 24(4): p. 320-327.
9. Tamim, N.S.M. and F. Ghani. Hilbert transform of FFT pruned cross correlation function for optimization in time delay estimation. in Communications (MICC), 2009 IEEE 9th Malaysia International Conference on. 2009.
10. Xiaoming, L. and H. Torp, Interpolation methods for time-delay estimation using cross-correlation method for blood velocity measurement. Ultrasonics, Ferroelectrics and Frequency Control, IEEE Transactions on, 1999. 46(2): p. 277-290.
11. Brandstein, M.S., Time-delay estimation of reverberated speech exploiting harmonic structure. The Journal of the Acoustical Society of America, 1999. 105(5): p. 2914-2919.
12. Brandstein, M.S. and H.F. Silverman. A robust method for speech signal time-delay estimation in reverberant rooms. in Acoustics, Speech, and Signal Processing, 1997. ICASSP-97., 1997 IEEE International Conference on. 1997.
13. Candy, J.V., Bayesian signal processing : classical, modern, and particle filtering methods : Adaptive and Learning Systems for Signal Processing, Communications and Control2009.
14. Ristic, B., Beyond the Kalman filter2004.
15. Yilmaz, O. and S. Rickard, Blind separation of speech mixtures via time-frequency masking. Signal Processing, IEEE Transactions on, 2004. 52(7): p. 1830-1847.
16. Cohen, I., Noise spectrum estimation in adverse environments: improved minima controlled recursive averaging. Speech and Audio Processing, IEEE Transactions on, 2003. 11(5): p. 466-475.
17. Cohen, I. and B. Berdugo, Speech enhancement for non-stationary noise environments. Signal Processing, 2001. 81(11): p. 2403-2418.
18. 杜宗憲, 雜訊刪減與有聲語音訊號重建之研究, in 電機工程學系, 國立清華大學: 新竹市. p. 74.
19. 林宏炬, 使用麥克風陣列與後處理器作噪音之降低, in 產業研發碩士積體電路設計專班2007, 國立清華大學: 新竹市. p. 48.
20. 林典蔚, 語音訊號中的雜訊預估與刪減方法研究, in 電機工程學系2007, 國立清華大學: 新竹市. p. 66.
21. 黃承德, 以麥克風陣列及語音預估為基礎的語音增強之研究, in 電機工程學系, 國立清華大學: 新竹市. p. 47.
22. 楊吉文, 以麥克風陣列與語音預估作語音增強之研究, in 電機工程學系2006, 國立清華大學: 新竹市. p. 55.
23. 廖育志, 結合雜訊抑制與帶聲語音重建之語音增強系統, in 電機工程學系2011, 國立清華大學: 新竹市. p. 56.
24. Benesty, J., C. Jingdong, and H. Yiteng, Time-delay estimation via linear interpolation and cross correlation. Speech and Audio Processing, IEEE Transactions on, 2004. 12(5): p. 509-519.
25. Parra, L.C. and C.V. Alvino, Geometric source separation: merging convolutive source separation with geometric beamforming. Speech and Audio Processing, IEEE Transactions on, 2002. 10(6): p. 352-362.
26. Valin, J.M., et al. Localization of simultaneous moving sound sources for mobile robot using a frequency- domain steered beamformer approach. in Robotics and Automation, 2004. Proceedings. ICRA '04. 2004 IEEE International Conference on. 2004.
27. Wenyi, Z. and B.D. Rao, A Two Microphone-Based Approach for Source Localization of Multiple Speech Sources. Audio, Speech, and Language Processing, IEEE Transactions on, 2010. 18(8): p. 1913-1928.
28. 林美慧, 解決頻域盲訊號分離的不明確問題, in 電機工程學系2011, 國立清華大學: 新竹市. p. 48.
29. 張慶霄, 麥克風陣列對移動音源之相對角度追蹤演算法設計, in 通訊工程研究所碩士在職專班2010, 國立中央大學: 桃園縣. p. 61.
30. 陳昭熙, 基於聯合近似對角化之即時語音分離系統, in 電機工程學系2009, 國立清華大學: 新竹市. p. 49.
31. 曾政傑, 基於多重訊號分類之聲源方位偵測, in 資訊工程系2008, 國立臺灣科技大學: 台北市. p. 73.
32. 顏嘉佑, 在時頻空間以二階段法作盲音源分離, in 電機工程學系2009, 國立清華大學: 新竹市. p. 54.