簡易檢索 / 詳目顯示

研究生: 林鴻嘉
Lin, Hung-Chia
論文名稱: 基於小波轉換與模型驗證之自動音素邊界點偵測
Phone Boundary Detection Based-on Wavelet Transform and Model Verification
指導教授: 王小川
Wang, Hsiao-Chuan
口試委員: 李琳山
王逸如
陳信宏
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 電機工程學系
Department of Electrical Engineering
論文出版年: 2011
畢業學年度: 99
語文別: 中文
論文頁數: 44
中文關鍵詞: 小波轉換高斯混合模型自動音素偵測
相關次數: 點閱:3下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本研究之目的是要在沒有提供任何已知的資訊下,將能暗示語音頻譜變化速率線索的參數相互的結合 ,設計一組強健性高的演算法,建構一個自動音素邊界偵測系統,供語音辨認與合成之應用。
    所提出的方法是一個文本不特定(Text-independent)的音素分段沿著時間一次只找一個語音段落中的候選音素邊界點,偵測候選音素邊界點時先將語音訊號分成小段,利用能量累積倒函數在每個小段中尋找候選音素邊界點(Candidate Phoneme Boundary)。接著再針對找到的候選音素邊界點作確認,以梅爾頻率倒頻譜係數為計算之頻譜轉變量測(Spectral transition measure,STM),加上以二維倒頻譜參數建立的混合高斯模型(Gaussian Mixture Model,GMM),進行候選音素邊界點的確認演算。以TIMIT語料進行音素邊界點偵測之測試評量,實驗結果顯示:在20ms容忍度下,對 5040句實驗語料作音素邊界偵測結果平均F-值約為81%。而平均R-值約為83%。而將音素邊界轉換作分類。分類擊中率較好的塞音轉母音,母音轉塞音皆有80%以上,且這兩種分類都佔全部分類有蠻高的比例,而在分類音素擊中辨識率中,這兩種分類的擊中率有73.8%與62.3%,最好的分類擊中辨識率是母音轉摩擦音,佔全部分類有7.12%。由實驗結果得知,系統之設計符合預期但仍有改善空間,今後應著眼於最佳化特徵參數之求取與演算法最佳化之整合。
    關鍵詞:文本不特定語音分段、小波轉換、高斯混合模型、自動音素偵測。


    第一章 緒論 第二章 語音特徵參數抽取 第三章  候選音素邊界點之偵測 第四章 音素邊界點之確認 第五章  實驗與討論 第六章 結論與未來展望

    Automatic segmentation of speech recorded in unknown noisy channel characteristics.On the Relation between Maximum Spectral Transition Positions and Phone Boundaries.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE