簡易檢索 / 詳目顯示

研究生: 梁峰誠
Feng-Cheng Liang
論文名稱: 利用語音訊號轉換與修改作為改善聽障者聽辨能力之研究
Improving speech perception capabilities of the hearing impaired with voice conversion and modification
指導教授: 王小川
Hsiao-Chuan Wang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 電機工程學系
Department of Electrical Engineering
論文出版年: 2005
畢業學年度: 93
語文別: 中文
論文頁數: 56
中文關鍵詞: 聽障者頻率壓縮與頻率轉移韻律修改語者轉換
相關次數: 點閱:2下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本論文是要對語音訊號做轉換或修改處理,期望處理後的語音訊號,能夠改善聽障者的聽辨能力。其中頻率壓縮與頻率轉移處理,合理利用聽障者的殘餘聽力,把聽障者聽不見的語音頻譜成份壓縮或轉移到聽障者的殘餘聽力內,實驗結果顯示,對於部分的聽障者可有效地改善聽辨能力。由於聽障者處理語音解碼的速度過慢,別人以正常速度跟他說話,他卻來不及聽,造成訊息接收不完整,故經常要求別人重複說明,或聽不懂別人的話,結果使語言溝通能力受影響。我們讓原本說話的速度變慢,可使聽者更容易聽得清楚,這也可以做為一種語言學習的工具。國語語音屬於聲調語言,而聽障者說的話往往缺乏抑揚頓挫,所以我們對基頻軌跡做修改,增加聲調的起伏,以期能改善聽障者聲調的聽辨能力,進而增強語言表達能力。我們實作的語音韻律修改系統,就是可供聽障者根據需求自由調整音調高低、說話速度及聲調起伏。另外為了探討聽障生是否會比較習慣某個人的說話特性,而在此人的聲音下接收能力特別好,所以我們提出一套語者轉換的方法,從實驗結果中發現,我們成功地將來源語者的聲音轉換成目標語者的聲音。例如此目標語者可以是聽障兒童的父母,這些聽障兒童可能較習慣父母的說話方式,將聲音轉換成他們的聲音後,語音的接收可能會有所改善。


    第一章 緒論...........................................1 1.1 研究動機........................................1 1.2 聽障的形成與協助...............................2 1.2.1 聽損的成因..................................3 1.2.2 補償的方法..................................3 1.3 研究方向........................................4 1.4 論文架構........................................5 第二章 頻率壓縮與頻率轉移....................6 2.1 頻率壓縮與頻率轉移處理的方法................7 2.2 聽力正常者的聽覺感知測驗.......................14 2.2.1 方法..................................14 2.2.2 測試材料...................................15 2.2.3 實驗結果...................................15 2.3 聽力損失者的聽覺感知測驗.......................17 第三章 韻律修改..........................20 3.1 基週同步疊加法PSOLA ...........................21 3.2 音調修改...............................25 3.3 說話速度修改...............................26 3.3 聲調起伏修改...............................29 第四章 語者轉換...........................30 4.1 線性預估編碼...............................31 4.2 訓綀資開的預處理........................33 4.3 線性轉換矩陣之訓綀.............................35 4.4 韻律參數轉換.................................37 4.5 語者轉換實驗..............................38 4.5.1 語音資料..................................38 4.5.2 語者轉換結果.............................39 4.5.3 客觀實驗—語者相似度......................40 4.5.4 主觀實驗—語音音質測驗....................42 4.5.5 主觀實驗—語者轉換正確性測驗..............43 第五章 結論與未來展望...............................46 參考文獻................................................49 附錄一 介面展示.......................................53 附錄二 實驗所用的測試材料...........................55

    [1] Olegs Timms, “Speech Processing Strategies Based on the Sinusoidal Speech Model for the Profoundly Hearing Impaired”
    , Diss., Technische Wissenschaften ETH Zürich, Nr. 15167, 2003
    [2] C. M. A. Navas, R. Urquiza, A. Gago Aguilera, “Frequency lowering using a discrete exponential transform”
    ,EUROSPEECH'99, pp.2769-2772
    [3] Munoz, C.M.A.; Nelson, P.B.; Rutledge, J.C. ,“Frequency lowering processing for listeners with significant hearing loss”, IEEE(1999), pp.741-744
    [4] Paarmann, L.D. Wynne, M.K. “Bimodal perception of spectrum compressed speech”, ICSLP 96 Vol.1169-172
    [5] 謝逸博,“以語音合成技術發展聽障者語言學習輔助系統”,
    國立清華大學電機工程研究所碩士論文,2001
    [6] Jian Lu; Uemi, N.; Gang Li; Ifukube, T., “Tone modifications used for improving the discrimination of mandarin words for the hearing-impaired”, IEEE(2000) pp.730 - 733
    [7] 何旻珊,“針對華語之助聽器補償策略平台建構”, 國立陽明大學醫學工程研究所碩士論文,2004
    [8] 楊秀春,“國語聲母聽辨測驗之編製研究”, 國立高雄師範大學特殊教育學系碩士論文,2002
    [9] 陳小娟,“三至八歲聽覺障礙兒童語音聽知覺接受力之研究”特殊教育與復健學報,第七期,1999
    [10] Eric Moulines, Jean Laroche “Non-parametric techniques for pitch-scale and time-scale modification of speech”,
    speech communication Vol.16 (1995) pp.175-205
    [11] Eric Moulines, Francis Charpentier “Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones”, speech communication Vol.9 (1990) pp.453-467
    [12] 王鴻彬, “國語聲訊處理”,國立交通大學電信工程研究所碩士論文, 1996
    [13] Holger Quast, Olaf Schreiner, Manfred R. Schroeder
    “Robust pitch tracking in the car environment”, ICASSP 2002 pp.I-353-I-356
    [14]王小川,“語音訊號處理”全華科技圖書, 2004
    [15]黃世明,“聲調辨識應用於聽障者發音訓練”, 國立清華大學電機工程研究所碩士論文,2003

    [16] Kain, A. “High resolution voice transformation”, PhD dissertation, OGI, 2001.
    [17] Ozgul Salor, Mubeccel Demirekler, Bryan Pellom, “A system for voice conversion based on adaptive filtering and line spectral frequency distance optimization for text-to-speech synthesis” Eurospeech 2003, pp. 2417-2420
    [18] 楊東敏,“基於線性預測編碼及音框基頻週期同步之高品質語音變換技術”,國立中央大學通訊工程研究所碩士論文,2003
    [19] Stylianou, Y., Cappe, O. and Moulines, E., “Continuous
    probabilistic transform for voice conversion”, IEEE Trans.
    on Speech and Audio Processing,vol.6, no.2, pp.131-142,1998.
    [20] Ye, H. and Young, S.. “Perceptually Weighted Linear Transformation for Voice Conversion”, Eurospeech 2003.
    [21] 何宗仁, “國語基本音節的頻域轉換”,國立交通大學電信工程研究所碩士論文, 2002
    [22] 周培廉,“語者之語音特微轉換”, 國立清華大學電機工程研究所碩士論文,2002
    [23] Turner C.W. and Hurtig R.R., "Proportional Frequency compression of speech for listeners with sensorineural hearing loss," J.Acoust.Soc.Am., vol.106, no. 2, pp. 877-886, 1999.
    [24] Posen MP, Reed CM, Braida L.D. “Intelligibility of frequency-lowered speech produced by a channel vocoder”, Journal of Rehabilitation Research and Development. 1993;30(1):26-38
    [25] McDermott H.J. and Dean M.R., "Speech perception with steeply sloping hearing loss: Effects of frequency transposition," British Journal of Audiology,2000.
    [26] Sakamoto S., Goto K., Tateno M., and Kaga K., "Frequency compression hearing aid for severe-to-profound hearing impairments," Auris Nasus Larynx, vol. 27 pp. 327-334, 2000.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE