研究生: |
梁峰誠 Feng-Cheng Liang |
---|---|
論文名稱: |
利用語音訊號轉換與修改作為改善聽障者聽辨能力之研究 Improving speech perception capabilities of the hearing impaired with voice conversion and modification |
指導教授: |
王小川
Hsiao-Chuan Wang |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
論文出版年: | 2005 |
畢業學年度: | 93 |
語文別: | 中文 |
論文頁數: | 56 |
中文關鍵詞: | 聽障者 、頻率壓縮與頻率轉移 、韻律修改 、語者轉換 |
相關次數: | 點閱:3 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
本論文是要對語音訊號做轉換或修改處理,期望處理後的語音訊號,能夠改善聽障者的聽辨能力。其中頻率壓縮與頻率轉移處理,合理利用聽障者的殘餘聽力,把聽障者聽不見的語音頻譜成份壓縮或轉移到聽障者的殘餘聽力內,實驗結果顯示,對於部分的聽障者可有效地改善聽辨能力。由於聽障者處理語音解碼的速度過慢,別人以正常速度跟他說話,他卻來不及聽,造成訊息接收不完整,故經常要求別人重複說明,或聽不懂別人的話,結果使語言溝通能力受影響。我們讓原本說話的速度變慢,可使聽者更容易聽得清楚,這也可以做為一種語言學習的工具。國語語音屬於聲調語言,而聽障者說的話往往缺乏抑揚頓挫,所以我們對基頻軌跡做修改,增加聲調的起伏,以期能改善聽障者聲調的聽辨能力,進而增強語言表達能力。我們實作的語音韻律修改系統,就是可供聽障者根據需求自由調整音調高低、說話速度及聲調起伏。另外為了探討聽障生是否會比較習慣某個人的說話特性,而在此人的聲音下接收能力特別好,所以我們提出一套語者轉換的方法,從實驗結果中發現,我們成功地將來源語者的聲音轉換成目標語者的聲音。例如此目標語者可以是聽障兒童的父母,這些聽障兒童可能較習慣父母的說話方式,將聲音轉換成他們的聲音後,語音的接收可能會有所改善。
[1] Olegs Timms, “Speech Processing Strategies Based on the Sinusoidal Speech Model for the Profoundly Hearing Impaired”
, Diss., Technische Wissenschaften ETH Zürich, Nr. 15167, 2003
[2] C. M. A. Navas, R. Urquiza, A. Gago Aguilera, “Frequency lowering using a discrete exponential transform”
,EUROSPEECH'99, pp.2769-2772
[3] Munoz, C.M.A.; Nelson, P.B.; Rutledge, J.C. ,“Frequency lowering processing for listeners with significant hearing loss”, IEEE(1999), pp.741-744
[4] Paarmann, L.D. Wynne, M.K. “Bimodal perception of spectrum compressed speech”, ICSLP 96 Vol.1169-172
[5] 謝逸博,“以語音合成技術發展聽障者語言學習輔助系統”,
國立清華大學電機工程研究所碩士論文,2001
[6] Jian Lu; Uemi, N.; Gang Li; Ifukube, T., “Tone modifications used for improving the discrimination of mandarin words for the hearing-impaired”, IEEE(2000) pp.730 - 733
[7] 何旻珊,“針對華語之助聽器補償策略平台建構”, 國立陽明大學醫學工程研究所碩士論文,2004
[8] 楊秀春,“國語聲母聽辨測驗之編製研究”, 國立高雄師範大學特殊教育學系碩士論文,2002
[9] 陳小娟,“三至八歲聽覺障礙兒童語音聽知覺接受力之研究”特殊教育與復健學報,第七期,1999
[10] Eric Moulines, Jean Laroche “Non-parametric techniques for pitch-scale and time-scale modification of speech”,
speech communication Vol.16 (1995) pp.175-205
[11] Eric Moulines, Francis Charpentier “Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones”, speech communication Vol.9 (1990) pp.453-467
[12] 王鴻彬, “國語聲訊處理”,國立交通大學電信工程研究所碩士論文, 1996
[13] Holger Quast, Olaf Schreiner, Manfred R. Schroeder
“Robust pitch tracking in the car environment”, ICASSP 2002 pp.I-353-I-356
[14]王小川,“語音訊號處理”全華科技圖書, 2004
[15]黃世明,“聲調辨識應用於聽障者發音訓練”, 國立清華大學電機工程研究所碩士論文,2003
[16] Kain, A. “High resolution voice transformation”, PhD dissertation, OGI, 2001.
[17] Ozgul Salor, Mubeccel Demirekler, Bryan Pellom, “A system for voice conversion based on adaptive filtering and line spectral frequency distance optimization for text-to-speech synthesis” Eurospeech 2003, pp. 2417-2420
[18] 楊東敏,“基於線性預測編碼及音框基頻週期同步之高品質語音變換技術”,國立中央大學通訊工程研究所碩士論文,2003
[19] Stylianou, Y., Cappe, O. and Moulines, E., “Continuous
probabilistic transform for voice conversion”, IEEE Trans.
on Speech and Audio Processing,vol.6, no.2, pp.131-142,1998.
[20] Ye, H. and Young, S.. “Perceptually Weighted Linear Transformation for Voice Conversion”, Eurospeech 2003.
[21] 何宗仁, “國語基本音節的頻域轉換”,國立交通大學電信工程研究所碩士論文, 2002
[22] 周培廉,“語者之語音特微轉換”, 國立清華大學電機工程研究所碩士論文,2002
[23] Turner C.W. and Hurtig R.R., "Proportional Frequency compression of speech for listeners with sensorineural hearing loss," J.Acoust.Soc.Am., vol.106, no. 2, pp. 877-886, 1999.
[24] Posen MP, Reed CM, Braida L.D. “Intelligibility of frequency-lowered speech produced by a channel vocoder”, Journal of Rehabilitation Research and Development. 1993;30(1):26-38
[25] McDermott H.J. and Dean M.R., "Speech perception with steeply sloping hearing loss: Effects of frequency transposition," British Journal of Audiology,2000.
[26] Sakamoto S., Goto K., Tateno M., and Kaga K., "Frequency compression hearing aid for severe-to-profound hearing impairments," Auris Nasus Larynx, vol. 27 pp. 327-334, 2000.