研究生: |
李銘浚 Ming-Jun Lee |
---|---|
論文名稱: |
應用獨立成分分析、對數頻譜預估、及頻率成分調整技術做語音增強之研究 A study on speech enhancement using independent component analysis,log-spectral amplitude estimation and frequency component modification techniques |
指導教授: |
王小川
Hsiao-Chuan Wang |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
論文出版年: | 2007 |
畢業學年度: | 95 |
語文別: | 中文 |
論文頁數: | 46 |
中文關鍵詞: | 獨立成分分析 、對數頻譜預估 、頻率成分調整技術 |
外文關鍵詞: | ICA, LSA |
相關次數: | 點閱:3 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
本篇論文的目的是發展一個能將語音訊號裡的背景雜訊去除的有效方法。我們安排了一個系統流程來去除雜訊,這個系統總共有三個階段,分別為頻域獨立成分分析、最佳化修正對數頻譜預估(OM-LSA)、以及頻率成分調整技術(FCMT)。首先,我們一開始使用頻域獨立成分分析(ICA)法來作為我們的第一階段去雜訊處理,這個方法是利用兩個聲源彼此間的獨立性,可以有效的分離出兩個通道中所接收到的兩個聲源訊號,但是實際上兩個聲源的獨立條件不會是如此的理想,所以還需做白色化處理使兩個聲源接近獨立。接下來我們使用最佳化修正對數頻譜預估(OM-LSA)來作為我們第二階段去雜訊處理,因為最佳化修正對數頻譜預估(OM-LSA)需要有參考雜訊頻譜的資訊,所以這裡我們調變以雜訊為主的聲源訊號的scale來作為參考雜訊,使用最佳化修正對數頻譜預估(OM-LSA)的演算法,進一步去除主聲源(即目標語音)中的雜訊,在經過前兩個階段之後,我們已經可以去除大部分的雜訊,尤其當麥克風收音端SNR在0dB以上時的效果最好,但是當麥克風收音端SNR在0dB以下時,做完以上的演算法之後還是會開始殘留少量的雜訊,因此我們最後再想出了使用頻率成分調整技術(FCMT),針對尚有殘留雜訊的語音資訊再進一步細微的去雜訊處理。實驗結果顯示,這樣的方法,在麥克風收音端SNR為-10dB以上時,可以有效的去除雜訊,在-10dB ~ -15dB之間也可以去除大部份的雜訊。
[1] A. J. Bell and T. J. Sejnowski, “An information-maximization
Approach to blind separation and blind deconvolution,” Neural
Comput., vol. 7,pp. 1129–1159, 1995.
[2] P. Comon, “Independent component analysis—A new
concept?,” Signal Processing, vol. 36, pp. 287–314,1994
[3] Qi Chen, Ying Guo, Yanli Duan, Bo Wang,”A LSA-MMSE Speech
Enhancement Approach Incorporating Masking Properties” The
Telecommunication Engineering Institute AFEU i'an,710077,
China,2006
[4] Israel Cohen , Baruch Berdugo “Speech enhancement for
non-stationarynoise environments”, Lamar Signal
Processing Ltd., P.O.Box 573, Yokneam Ilit 20692, Israel,
2001
[5] P. Comon, “Tensor diagonalization, a useful tool in signal
processing,” in IFAC-SYSID, 10th IFAC Symposium on System
Identification, M. Blanke and T. Soderstrom, Eds., vol. 1,
Copenhagen, Denmark, 1994, pp. 77–82.
[6] Y. Ephraim, D. Malah, “Speech enhancement using a minimum
mean-square error log-spectral amplitude estimator”, IEEE
Trans. Acoust. Speech Signal Process.ASSP-33 (2),April 1985
[7] A. Hyvärinen and E. Oja, “A fast fixed-point algorithm for
Independent component analysis,” Neural Comput., vol. 9,
pp.1483–1492, 1997.
[8] S. Kurita, H. Saruwatari, S. Kajita, K. Takeda, and F. Itakura,
"Evaluation of blind signal separation method using
Directivity pattern under reverberant conditions," Proc.
ICASSP2000,pp.3140--3143, 2000.
[9] Jin-Chiuan Kuo,”Blind Source Separation Based on the
Joint Diagonalization of Time-Delayed Covariance Matrix”,
國立清華大學電機工程學系碩士論文,June 2006
[10] T.-W. Lee, M. Girolami, and T. Sejnowski, “Independent
component analysis using an extended infomax algorithm for
mixed sub-gaussian and super-gaussian sources,” Neural
Computation, vol. 11, no. 2,pp.409–433, 1999.
[11] Yi-Ru Lian,”An investigation of frequency domain ICA for
speech signal separation”,Department of Electrical and
Control Engineering College of Electrical Engineering and
Computer Science National Chiao Tung University,July 2004
[12] DT Pham, Ch. Servi`ere, and H. Boumaraf, “Blind separation.
of convolutive audio mixtures using nonstationarity”,
Proceeding of ICA 2003 Conference, pp. 975-980 , Nara,
Japan April 2003
[13] L. Tong, V. C. Soon, Y. -F. Huang and R. Lin, “AMUSE: A new
blind identification algorithm,” Proc.IEEE International
Symposium on Circuits and Systems, New Orleans, LA., May 1-3,
1990, vol. 3, pp.1784-1787.
[14] 王小川教授編箸,”語音訊號處理”,全華科技圖書公司,2004