研究生: |
林鴻嘉 Lin, Hung-Chia |
---|---|
論文名稱: |
基於小波轉換與模型驗證之自動音素邊界點偵測 Phone Boundary Detection Based-on Wavelet Transform and Model Verification |
指導教授: |
王小川
Wang, Hsiao-Chuan |
口試委員: |
李琳山
王逸如 陳信宏 |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
論文出版年: | 2011 |
畢業學年度: | 99 |
語文別: | 中文 |
論文頁數: | 44 |
中文關鍵詞: | 小波轉換 、高斯混合模型 、自動音素偵測 |
相關次數: | 點閱:3 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
本研究之目的是要在沒有提供任何已知的資訊下,將能暗示語音頻譜變化速率線索的參數相互的結合 ,設計一組強健性高的演算法,建構一個自動音素邊界偵測系統,供語音辨認與合成之應用。
所提出的方法是一個文本不特定(Text-independent)的音素分段沿著時間一次只找一個語音段落中的候選音素邊界點,偵測候選音素邊界點時先將語音訊號分成小段,利用能量累積倒函數在每個小段中尋找候選音素邊界點(Candidate Phoneme Boundary)。接著再針對找到的候選音素邊界點作確認,以梅爾頻率倒頻譜係數為計算之頻譜轉變量測(Spectral transition measure,STM),加上以二維倒頻譜參數建立的混合高斯模型(Gaussian Mixture Model,GMM),進行候選音素邊界點的確認演算。以TIMIT語料進行音素邊界點偵測之測試評量,實驗結果顯示:在20ms容忍度下,對 5040句實驗語料作音素邊界偵測結果平均F-值約為81%。而平均R-值約為83%。而將音素邊界轉換作分類。分類擊中率較好的塞音轉母音,母音轉塞音皆有80%以上,且這兩種分類都佔全部分類有蠻高的比例,而在分類音素擊中辨識率中,這兩種分類的擊中率有73.8%與62.3%,最好的分類擊中辨識率是母音轉摩擦音,佔全部分類有7.12%。由實驗結果得知,系統之設計符合預期但仍有改善空間,今後應著眼於最佳化特徵參數之求取與演算法最佳化之整合。
關鍵詞:文本不特定語音分段、小波轉換、高斯混合模型、自動音素偵測。
Automatic segmentation of speech recorded in unknown noisy channel characteristics.On the Relation between Maximum Spectral Transition Positions and Phone Boundaries.