簡易檢索 / 詳目顯示

研究生: 洪晟銘
論文名稱: 轉移模型與補模型在語音辨識的應用
指導教授: 江永進
口試委員:
學位類別: 碩士
Master
系所名稱: 理學院 - 統計學研究所
Institute of Statistics
論文出版年: 2003
畢業學年度: 91
語文別: 中文
論文頁數: 35
中文關鍵詞: 轉移模型補模型語音辨識
外文關鍵詞: transition model, complementary model, speech recognition
相關次數: 點閱:2下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 過去,三音模型(triphone)已經被證明是表現最好的聲學模型,比雙音模型(biphone)及單音模型(monophone)更好;不過,三音模型之所以表現如此之好,主要原因是其所需要估計的參數比雙音模型及單音模型多出許多的緣故。所以,要訓練三音模型所需要的訓練語料自然比其他的聲學模型還要多,然而,這並非對所有的語音研究都是可能的。
    在這篇論文,我們將介紹一種新的聲學模型---轉移模型(transition phone model)。在某些情況下,其所需要估計的參數數目與單音模型差不多;但其所表現出來的效果與雙音模型是差不多的,甚至在訓練語料不足時,它的表現可以比三音模型更好。

    除了轉移模型以外,我們還介紹另一個新的觀念--- complementary model,利用complementary model的觀念,可以凸顯這段未知其內容的聲音在“對”的模型的可能性(likelihood),降低其在 “錯”的模型的可能性(likelihood)。這不僅可增加切段(force alignment)的準確度,還可增加辨識率。


    第一章 前言 ………………………………………………………….1 第二章 增加轉移模型的單音模型 …………………………………..3 2.1 動機 ……………………………………………….…….3 2.2 訓練轉移模型 ……………………………………………6 2.3 辨識 ……………………………………………………..8 2.4 台語數字辨識 ……………………………………………8 第三章 補模型 ……………………………………………………11 3.1 動機及訓練方法 …………………………………………………11 3.2 Ranking Sum指標 ………………………………………………….14 3.3 補模型與Ranking Sum指標 ……………………………………….16 3.4 概似比 ……………………………………………………18 3.5 概似比實驗 ……………………………………………….19 第四章 轉移模型的大詞彙辨識 ……………………………………...23 4.1 語者相關的大詞彙辨識 …………………………………23 4.2 語者獨立的大詞彙辨識 …………………………………26 第五章 結論 ………………………………………………………...28 參考文獻 ……………………………………………………………..29 附錄 …………………………………………………………………30

    L. R. Rabiner, 1989, “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition”, Proceedings of the IEEE, 77 (2): 257-286.
    M. A. T. Figueiredo, and A. K. Jain, 2000, “Unsupervised Learning of Finite Mixture Models”, IEEE Transactions on Pattern Analysis and Machine Intelligence 24(3): 381-396.
    F. Jelinek, 1998, “Statistical Methods for Speech Recognition”.
    HTK book, v3.1
    呂道誠, 2000, “Speaker Independent Acoustic Modeling for Large Vocabulary Bi-lingual Mandarin/Taiwanese Continuous Speech Recognition”.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)
    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE