簡易檢索 / 詳目顯示

研究生: 李銘浚
Ming-Jun Lee
論文名稱: 應用獨立成分分析、對數頻譜預估、及頻率成分調整技術做語音增強之研究
A study on speech enhancement using independent component analysis,log-spectral amplitude estimation and frequency component modification techniques
指導教授: 王小川
Hsiao-Chuan Wang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 電機工程學系
Department of Electrical Engineering
論文出版年: 2007
畢業學年度: 95
語文別: 中文
論文頁數: 46
中文關鍵詞: 獨立成分分析對數頻譜預估頻率成分調整技術
外文關鍵詞: ICA, LSA
相關次數: 點閱:2下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本篇論文的目的是發展一個能將語音訊號裡的背景雜訊去除的有效方法。我們安排了一個系統流程來去除雜訊,這個系統總共有三個階段,分別為頻域獨立成分分析、最佳化修正對數頻譜預估(OM-LSA)、以及頻率成分調整技術(FCMT)。首先,我們一開始使用頻域獨立成分分析(ICA)法來作為我們的第一階段去雜訊處理,這個方法是利用兩個聲源彼此間的獨立性,可以有效的分離出兩個通道中所接收到的兩個聲源訊號,但是實際上兩個聲源的獨立條件不會是如此的理想,所以還需做白色化處理使兩個聲源接近獨立。接下來我們使用最佳化修正對數頻譜預估(OM-LSA)來作為我們第二階段去雜訊處理,因為最佳化修正對數頻譜預估(OM-LSA)需要有參考雜訊頻譜的資訊,所以這裡我們調變以雜訊為主的聲源訊號的scale來作為參考雜訊,使用最佳化修正對數頻譜預估(OM-LSA)的演算法,進一步去除主聲源(即目標語音)中的雜訊,在經過前兩個階段之後,我們已經可以去除大部分的雜訊,尤其當麥克風收音端SNR在0dB以上時的效果最好,但是當麥克風收音端SNR在0dB以下時,做完以上的演算法之後還是會開始殘留少量的雜訊,因此我們最後再想出了使用頻率成分調整技術(FCMT),針對尚有殘留雜訊的語音資訊再進一步細微的去雜訊處理。實驗結果顯示,這樣的方法,在麥克風收音端SNR為-10dB以上時,可以有效的去除雜訊,在-10dB ~ -15dB之間也可以去除大部份的雜訊。


    第一章 緒論.................................................1 1.1 研究動機........................................1 1.2 研究方向與系統架構..............................1 1.3 章節概要........................................3 第二章 使用頻域獨立成分分析去除雜訊.........................4 (Noise reduction in frequency domain using INDEPENDENT COMPONENT ANALYSIS ,ICA) 2.1 盲訊號分離之問題描述.............................4 2.2 獨立成分分析基本概念.............................6 2.3 獨立成分分析處裡流程.............................7 2.3.1集中變數(centering)........................8 2.3.2資料白色化(whitening)......................9 2.3.3解混合矩陣(demixing matrix)...............10 2.4 頻域獨立成分分析演算法..........................11 2.4.1共同對角化時間延遲cross-power spectrum演算法 求解混合矩陣(demixing matrix).............13 2.4.2膨脹問題與排列問題(Dilation,Permutation)..14 第三章 使用最佳化修正對數頻譜預估去除雜訊..................17 (Noise reduction using OPTIMALLY-MODIFIED LOG-SPECTRAL AMPLITUDE ESTIMATION,OM-LSA) 3.1 OM-LSA algorithm.................................18 3.2 預估參數的求取..................................21 3.2.1雜訊頻譜預估(Noise spectrum estimation)....21 3.2.2事後訊噪比(posteriori SNR).................22 3.2.3事前訊噪比(priori SNR).....................23 3.2.4語音存在機率預估..........................23 第四章 使用頻率成分調整技術後置處理去除雜訊................25 (Post processing using FREQUENCY COMPONENT MODIFICATION TECHNIQUES to reduce noise,FCMT) 4.1基本原理與假設..................................25 4.2頻率成分臨界值的計算............................27 第五章 實驗結果與討論......................................31 5.1 實驗環境........................................31 5.2 實驗規劃........................................32 5.3 實驗結果........................................32 第六章 結論與未來展望......................................43 參考文獻......................................................44

    [1] A. J. Bell and T. J. Sejnowski, “An information-maximization
    Approach to blind separation and blind deconvolution,” Neural
    Comput., vol. 7,pp. 1129–1159, 1995.
    [2] P. Comon, “Independent component analysis—A new
    concept?,” Signal Processing, vol. 36, pp. 287–314,1994
    [3] Qi Chen, Ying Guo, Yanli Duan, Bo Wang,”A LSA-MMSE Speech
    Enhancement Approach Incorporating Masking Properties” The
    Telecommunication Engineering Institute AFEU i'an,710077,
    China,2006
    [4] Israel Cohen , Baruch Berdugo “Speech enhancement for
    non-stationarynoise environments”, Lamar Signal
    Processing Ltd., P.O.Box 573, Yokneam Ilit 20692, Israel,
    2001
    [5] P. Comon, “Tensor diagonalization, a useful tool in signal
    processing,” in IFAC-SYSID, 10th IFAC Symposium on System
    Identification, M. Blanke and T. Soderstrom, Eds., vol. 1,
    Copenhagen, Denmark, 1994, pp. 77–82.
    [6] Y. Ephraim, D. Malah, “Speech enhancement using a minimum
    mean-square error log-spectral amplitude estimator”, IEEE
    Trans. Acoust. Speech Signal Process.ASSP-33 (2),April 1985
    [7] A. Hyvärinen and E. Oja, “A fast fixed-point algorithm for
    Independent component analysis,” Neural Comput., vol. 9,
    pp.1483–1492, 1997.
    [8] S. Kurita, H. Saruwatari, S. Kajita, K. Takeda, and F. Itakura,
    "Evaluation of blind signal separation method using
    Directivity pattern under reverberant conditions," Proc.
    ICASSP2000,pp.3140--3143, 2000.
    [9] Jin-Chiuan Kuo,”Blind Source Separation Based on the
    Joint Diagonalization of Time-Delayed Covariance Matrix”,
    國立清華大學電機工程學系碩士論文,June 2006
    [10] T.-W. Lee, M. Girolami, and T. Sejnowski, “Independent
    component analysis using an extended infomax algorithm for
    mixed sub-gaussian and super-gaussian sources,” Neural
    Computation, vol. 11, no. 2,pp.409–433, 1999.
    [11] Yi-Ru Lian,”An investigation of frequency domain ICA for
    speech signal separation”,Department of Electrical and
    Control Engineering College of Electrical Engineering and
    Computer Science National Chiao Tung University,July 2004
    [12] DT Pham, Ch. Servi`ere, and H. Boumaraf, “Blind separation.
    of convolutive audio mixtures using nonstationarity”,
    Proceeding of ICA 2003 Conference, pp. 975-980 , Nara,
    Japan April 2003
    [13] L. Tong, V. C. Soon, Y. -F. Huang and R. Lin, “AMUSE: A new
    blind identification algorithm,” Proc.IEEE International
    Symposium on Circuits and Systems, New Orleans, LA., May 1-3,
    1990, vol. 3, pp.1784-1787.
    [14] 王小川教授編箸,”語音訊號處理”,全華科技圖書公司,2004

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE