以可聽覺遮蔽門檻為基礎的語音增強研究｜國立清華大學博碩士論文庫

簡易檢索 / 詳目顯示

回結果列表

研究生：	黃柏凱 Po-Kai Huang
論文名稱：	以可聽覺遮蔽門檻為基礎的語音增強研究 speech enhancement based on audible masking threshold
指導教授：	王小川 Hsiao-Chuan Wang
口試委員:
學位類別：	碩士 Master
系所名稱：	電機資訊學院 - 電機工程學系 Department of Electrical Engineering
論文出版年：	2005
畢業學年度：	93
語文別：	中文
論文頁數：	66
中文關鍵詞：	聽障者、語音增強
外文關鍵詞：	hearing-impaired listener, speech enhancement
相關次數：	點閱：2 下載：0
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

助聽器的目地在於幫助聽障者更容易接收聲音，基本原理就是將各頻率成分個別做不同的放大及設定，以增強聽者的語音辨別能力。但事實上許多患者不願戴助聽器或對助聽器不滿意最大的原因之一，就是覺得很吵，聽到了一些不該被放大的環境雜訊聲音。因此，若要避免使用者感到不舒適，可以有兩種方法，方法一是將助聽器的最後輸出功率調整在不舒適響度值之下，這樣就不會傷害剩餘的聽力;方法二則是設法去增強語音訊號的部分，也就是放大語音且抑制雜訊。本論文為了避免使用者在吵雜環境裡感到不舒適，利用聽覺遮蔽效應的概念來做語音增強，並且以等效矩形頻寬的分頻法及圓通化指數模型描述人耳聽覺上的特性，進而求取聽覺遮蔽門檻值，期望能夠依人耳聽力受損程度進行不同的增強演算。最後對於增強後的訊號，再以梳狀濾波器加強母音的諧波結構，使得原先被破壞掉的較高頻成分訊號能夠重新保留住，並且在噪音環境下對聽障者提供最大幫助。
　　實驗分為客觀評量和主觀評量兩部分，客觀評量評估SNR-改進、頻譜失真量測、Itakura-Saito距離評估。主觀評量評估訊號增強前後聽者的語音辨識能力，測驗者分為正常者及聽障者。實驗結果顯示，對於正常者改善效果不大，但對於聽障者辨識正確率則有一定程度成長。

第一章   緒論...........................................1
   1.1    研究背景........................................1
   1.2    研究方向........................................2
   1.3    章節介紹........................................4
第二章　語音增強芳法介紹..............................6
2.1    傳統方法介紹....................................6
　　  2.1.1    頻譜刪減法...............................6
　　  2.1.2    韋納濾波器...............................6
　　  2.1.3    最小均方誤差值預估(MMSE)...................7
2.2    系統說明.........................................9
第三章   語音預估.....................................13
   3.1    雜訊頻譜預估...................................13
　　  3.1.1    時變遞迴平均.............................13
　　  3.1.2    最小頻譜預估.............................15
   3.2    語音頻譜預估................................18
第四章   聽覺遮蔽門檻值...............................23
   4.1    聽覺濾波器模型.................................23
   4.2    激發樣型的計算.................................24
   4.3    門檻值的估計...................................30
第五章   具聽覺遮蔽效應的語音增強系統...............34
   5.1     值的推導過程...............................35
   5.2    聽覺噪音消除................................38
   5.3    加強諧波成份..................................39
5.4    將訊號從頻域轉回時域...........................41
第六章   實驗結果與討論........................42
   6.1    客觀評量.......................................42
   6.1.1    SNR、IS-distance及SD值.................42
   6.1.2    實驗結果與討論...........................44
   6.2    主觀評量.......................................50
   6.2.1    聽力檢測系統............................51
   6.2.2    測驗畫面介紹............................55
   6.2.3    測驗結果與討論...........................58
第七章   結論與未來展望...............................60
7.1    結論...........................................60
   7.2    未來展望.......................................60
參考文獻................................................62
附錄一..................................................66

                                

[1] Cohen, I. ,“Noise Spectrum Estimation in Adverse Environments : Improved Minima Controlled Recursive Averaging
” Speech and Audio Processing, IEEE Transactions on
Volume 11, Issue 5, Sept. 2003 Page(s):466 – 475.
[2] Cohen, I.; Berdugo, B.,”Noise estimation by minima controlled recursive averaging for robust speech enhancement”, Signal Processing Letters, IEEE Volume 9, Issue 1, Jan. 2002 Page(s):12 – 15.
[3] Ephraim ,Y. ,Malah ,D. ,”Speech enhancement using a minimum mean square error short-time spectral amplitude estimator”, IEEE. Trans. Acoust. Speech Signal Processing. .ASSp-32(6) (December 1984) 1109-1121.
[4] Martin, R.”Noise power spectral density estimation based on optimal smoothing and minimum statistics,”,IEEE Trans. Speech Audio Processing, vol. 9, pp. 504–512, July 2001.
[5] Ephraim ,Y. ,Malah ,D., “Speech enhancement using a minimum mean-square error log-spectral amplitude estimator”, IEEE Trans. Speech Audio Processing,(April 1985) 443-445.
[6] Cohen ,I. ,Berdugo ,B. ,"Speech Enhancement for Nonstationary noise environments," Signal Processing, vol.81, pp. 2403-2418, Aug. 2001. [OM-LSA].
[7] Natarajan, A., Hansen, J.H.L , Arehart, K. , Rossi-Katz ,J.A. “Perceptual based speech enhancement for normal-hearing & hearing-impaired individuals, “ Eurospeech 2003, pp1425-1428
[8] Brian C.J. Moore ,Brian R.Glasberg “A revised model of loudness perception applied to cochlear hearing loss, ” Hearing Research 188 (2004) 70-88.
[9] Baer,T. ,and Moore, B.C.J.(1993). “Effects of spectral smearing on the intelligibility of sentences in the presence of noise,”, J.Acoust.Soc.Amer.94,1229-1241.
[10] H. Traunmüller (1990) "Analytical expressions for the tonotopic sensory scale" J. Acoust. Soc. Am. 88: 97-100.
[11] http://www.ling.su.se/staff/hartmut/bark.htm
[12] Fillon,T. Parado,J. “Evaluation of an ERB frequency scale noise reduction for hearing aids: A comparative study,” Speech Commun. Vol 39,23-32 ,2003.
[13] Johnston, J.D., “Transform coding of audio signal using perceptual noise criteria,”,IEEE J.Select.Areas Commum. ,Vol.6, pp.314-323, Feb.1988
[14]林輝彥，　＂應用具聽覺效應之模型於噪音環境中語音辨識,”　國立成功大學資訊工程研究所碩士論文,2001
[15] Tsoukalas, D.E. Mourjoupoulos, J.and Kokkinakis, G.”Speech enhancement based on audible noise suppression,” IEEE Trans. Speech & Audio Proc.,5(6):497-514,1997
[16] Arehart, K.H. ,Hansen, J.H.L., Gallant,S. and Kalstein, L.“Evaluation of An auditory masked threshold noise suppression algorithm in normal-hearing and hearing-impaired listeners,”Speech Commun,Vol 40(4):575-592 June 2003
[17]葉向林，”聽障者之語音增強與轉換”，國立清華大學電機工程研究所碩士論文, 2004
[18] A. T. Yu and H. C. Wang , New speech harmonic structure measure and its application to post speech enhancement , IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP2004, Montreal, Canada, 2004.
[19] Deller,Jr.J.R. ,Hansen.J.H.L., Proakis,J.G. “Discrete-Time Processing of Speech Signals,” An IEEE PRESS Classic Reissue 1993
[20] 王小川編著 ,＂語音訊號處理＂2004
[21] Moore, B.C.J. and Glasberg, B.R. A model of loudness perception applied to cochlear hearing loss Auditory Neuroscience, vol. 3, pp. 289-311, 1997.
[22] Steven, F.B. ,”Suppression of Acoustic Noise in Speech Using Spectral Subtraction,”IEEE Trans.on Acoustics,speech, and Signal Processing,Vol.ASSP-27,NO.2,pp.113-120,April 1979
[23] Schroeder, M.R., Hall, J.H. and Atal, B.S. “Optimizing digital speech coders by exploiting the masking properties of the human ear”. JASA, 66(6):1647–1652, 1979.
[24] 陳小娟　“三至八歲聾童語音聽知覺研究”，特殊教育復健學報，(民88)
[25] http://www.hearingaid.com.tw/DrLiu/DrLiu1-1.htm

全文公開日期本全文未授權公開 (校內網路)
全文公開日期本全文未授權公開 (校外網路)

簡易檢索 / 詳目顯示

相關論文