簡易檢索 / 詳目顯示

研究生: 梁翰銘
Liang, Hang-Ming
論文名稱: 利用粒子濾波器與麥克風陣列進行直角座標上多聲源之追蹤
Multiple Sound Source Tracking Using Microphone Arrays and Particle Filter
指導教授: 劉奕汶
Liu, Yi-Wen
口試委員: 白明憲
王小川
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 電機工程學系
Department of Electrical Engineering
論文出版年: 2012
畢業學年度: 101
語文別: 中文
論文頁數: 50
中文關鍵詞: 聲源定位聲源追蹤
外文關鍵詞: sound source localization, sound source tracking
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 傳統聲源定位的方法大多利用當下時刻麥克風陣列所收到的資訊來計算聲源位置;但由於聲源位置估計可能因迴響而造成定位劇烈誤差,故本論文以聲源到達兩相鄰麥克風之間的相對時間延遲(TDOA,Time duration of arrival)為基礎,利用粒子濾波器(Particle Filter)對聲源做追蹤以避免定位誤差的產生。但由於聲源追蹤仍存在著無法追蹤非單一非連續聲源的狀況,故本論文提出了一個架構,針對粒子濾波器無法追蹤非單一連續出聲聲源的狀況做改善,藉此完成一個相對可靠的多聲源的聲源追蹤定位系統。
    本論文所提出的架構共分成兩個主要的部份,第一個部分提出了聲源追蹤的重置機制,利用這個重製的機制我們可以避免掉追蹤物不存在的狀況;第二個部分為聲源數的即時確認機制,本論文以不同的位置有不同的聲源及不同的聲源具有不同的內容為假設,利用聲源萃取來分離聲源,並以分離出來的聲源提出一個聲源數目確認的機制,利用這個機制我們可以即時的確認聲源數目,解決因聲源數目未知所產生的定位誤差,最後經由實驗證實本論文所提出的兩項機制確實能夠解決傳統聲源追蹤輔助定位會發生的困難,並減少因空間迴響所造成的定位誤差。


    中文摘要 i Abstract ii 誌謝 iii 第一章 概論 1 1.1研究動機與目的 1 1.2問題簡介 1 1.3 研究方向與目標 2 1.4章節介紹 2 第二章 直角座標的聲源定位的相關研究 3 2.1直角坐標聲源定位 4 2.2由接收到的聲音信號估計相對延遲τ 6 交互相關函數(CC,Cross Correlation) 7 廣義交互相關函數(GCC,Generalize Cross Correlation) 8 2.3討論 10 討論一:時間延遲估計的合理範圍 10 討論二:時間延遲估計的解析度不足 11 改善時間延遲估計解析度 11 討論三:利用廣義交相關函數估計信號間延遲的缺點 13 改善訊號時間延遲估計的不合理處 16 第三章 利用聲源追蹤輔助定位 18 3.1聲源追蹤的概念 18 3.2粒子濾波器(Particle Filter) 19 3.3討論 22 討論一: 重點重複取樣及動態估計參數對聲源追蹤的影響 22 討論二:利用聲源追蹤輔助定位的缺點 23 改善方法一: 26 改善方法二: 27 第四章 聲源萃取 28 4.1時頻遮罩(Time Frequency Masking) 29 4.2對數頻譜大小最佳修正(OMLSA) 32 4.3討論 34 討論一:利用聲源定位資訊萃取聲源 34 討論二:利用聲源萃取判斷聲源數 36 討論三:追蹤粒子分群以改善多聲源同時存在的定位 37 第五章 本論文所提出的架構 38 聲源監控系統流程圖 38 第六章 實驗與討論 39 實驗環境 39 實驗裝置設置 39 實驗參數設定 40 實驗位置表 40 實驗一:定位方法改善對固定位置單聲源定位準確度的比較 41 實驗討論一: 42 實驗二:聲源追蹤之定位隨時間的收斂性 43 實驗討論二: 43 實驗三:單聲源追蹤(動態聲源追蹤) 44 實驗討論三: 44 實驗四:雙點非連續聲源定位 45 實驗討論四 45 實驗五:雙聲源定位 46 實驗討論五: 46 第七章 結論與未來展望 47 參考文獻 48

    1. Nakadai, K., et al. Applying scattering theory to robot audition system: robust sound source localization and extraction. in Intelligent Robots and Systems, 2003. (IROS 2003). Proceedings. 2003 IEEE/RSJ International Conference on. 2003.
    2. Valin, J.M., J. Rouat, and F. Michaud. Enhanced robot audition based on microphone array source separation with post-filter. in Intelligent Robots and Systems, 2004. (IROS 2004). Proceedings. 2004 IEEE/RSJ International Conference on. 2004.
    3. Vermaak, J. and A. Blake. Nonlinear filtering for speaker tracking in noisy and reverberant environments. in Acoustics, Speech, and Signal Processing, 2001. Proceedings. (ICASSP '01). 2001 IEEE International Conference on. 2001.
    4. Liang, Z., X. Ma, and X. Dai, Robust tracking of moving sound source using scaled unscented particle filter. Applied Acoustics, 2008. 69(8): p. 673-680.
    5. Ward, D.B., E.A. Lehmann, and R.C. Williamson, Particle filtering algorithms for tracking an acoustic source in a reverberant environment. Speech and Audio Processing, IEEE Transactions on, 2003. 11(6): p. 826-836.
    6. Valin, J.M., et al. Robust sound source localization using a microphone array on a mobile robot. in Intelligent Robots and Systems, 2003. (IROS 2003). Proceedings. 2003 IEEE/RSJ International Conference on. 2003.
    7. 楊善翔, 聲源三維方位偵測之研究, in 資訊工程系2009, 國立臺灣科技大學: 台北市. p. 78.
    8. Knapp, C. and G. Carter, The generalized correlation method for estimation of time delay. Acoustics, Speech and Signal Processing, IEEE Transactions on, 1976. 24(4): p. 320-327.
    9. Tamim, N.S.M. and F. Ghani. Hilbert transform of FFT pruned cross correlation function for optimization in time delay estimation. in Communications (MICC), 2009 IEEE 9th Malaysia International Conference on. 2009.
    10. Xiaoming, L. and H. Torp, Interpolation methods for time-delay estimation using cross-correlation method for blood velocity measurement. Ultrasonics, Ferroelectrics and Frequency Control, IEEE Transactions on, 1999. 46(2): p. 277-290.
    11. Brandstein, M.S., Time-delay estimation of reverberated speech exploiting harmonic structure. The Journal of the Acoustical Society of America, 1999. 105(5): p. 2914-2919.
    12. Brandstein, M.S. and H.F. Silverman. A robust method for speech signal time-delay estimation in reverberant rooms. in Acoustics, Speech, and Signal Processing, 1997. ICASSP-97., 1997 IEEE International Conference on. 1997.
    13. Candy, J.V., Bayesian signal processing : classical, modern, and particle filtering methods : Adaptive and Learning Systems for Signal Processing, Communications and Control2009.
    14. Ristic, B., Beyond the Kalman filter2004.
    15. Yilmaz, O. and S. Rickard, Blind separation of speech mixtures via time-frequency masking. Signal Processing, IEEE Transactions on, 2004. 52(7): p. 1830-1847.
    16. Cohen, I., Noise spectrum estimation in adverse environments: improved minima controlled recursive averaging. Speech and Audio Processing, IEEE Transactions on, 2003. 11(5): p. 466-475.
    17. Cohen, I. and B. Berdugo, Speech enhancement for non-stationary noise environments. Signal Processing, 2001. 81(11): p. 2403-2418.
    18. 杜宗憲, 雜訊刪減與有聲語音訊號重建之研究, in 電機工程學系, 國立清華大學: 新竹市. p. 74.
    19. 林宏炬, 使用麥克風陣列與後處理器作噪音之降低, in 產業研發碩士積體電路設計專班2007, 國立清華大學: 新竹市. p. 48.
    20. 林典蔚, 語音訊號中的雜訊預估與刪減方法研究, in 電機工程學系2007, 國立清華大學: 新竹市. p. 66.
    21. 黃承德, 以麥克風陣列及語音預估為基礎的語音增強之研究, in 電機工程學系, 國立清華大學: 新竹市. p. 47.
    22. 楊吉文, 以麥克風陣列與語音預估作語音增強之研究, in 電機工程學系2006, 國立清華大學: 新竹市. p. 55.
    23. 廖育志, 結合雜訊抑制與帶聲語音重建之語音增強系統, in 電機工程學系2011, 國立清華大學: 新竹市. p. 56.
    24. Benesty, J., C. Jingdong, and H. Yiteng, Time-delay estimation via linear interpolation and cross correlation. Speech and Audio Processing, IEEE Transactions on, 2004. 12(5): p. 509-519.
    25. Parra, L.C. and C.V. Alvino, Geometric source separation: merging convolutive source separation with geometric beamforming. Speech and Audio Processing, IEEE Transactions on, 2002. 10(6): p. 352-362.
    26. Valin, J.M., et al. Localization of simultaneous moving sound sources for mobile robot using a frequency- domain steered beamformer approach. in Robotics and Automation, 2004. Proceedings. ICRA '04. 2004 IEEE International Conference on. 2004.
    27. Wenyi, Z. and B.D. Rao, A Two Microphone-Based Approach for Source Localization of Multiple Speech Sources. Audio, Speech, and Language Processing, IEEE Transactions on, 2010. 18(8): p. 1913-1928.
    28. 林美慧, 解決頻域盲訊號分離的不明確問題, in 電機工程學系2011, 國立清華大學: 新竹市. p. 48.
    29. 張慶霄, 麥克風陣列對移動音源之相對角度追蹤演算法設計, in 通訊工程研究所碩士在職專班2010, 國立中央大學: 桃園縣. p. 61.
    30. 陳昭熙, 基於聯合近似對角化之即時語音分離系統, in 電機工程學系2009, 國立清華大學: 新竹市. p. 49.
    31. 曾政傑, 基於多重訊號分類之聲源方位偵測, in 資訊工程系2008, 國立臺灣科技大學: 台北市. p. 73.
    32. 顏嘉佑, 在時頻空間以二階段法作盲音源分離, in 電機工程學系2009, 國立清華大學: 新竹市. p. 54.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE