研究生: |
劉佑德 You-Te Liu |
---|---|
論文名稱: |
多關鍵詞文句之辨認方法 Keyword Spotting for Multi-keyword Sentences |
指導教授: |
王小川博士
Prof. Hsiao-Chuan Wang |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
論文出版年: | 2001 |
畢業學年度: | 89 |
語文別: | 中文 |
論文頁數: | 55 |
中文關鍵詞: | 關鍵詞 、一階動態規劃演算法 、隱藏式馬可夫模型 、辭典擴充 、放寬長詞限制 、音節格狀輸出 |
外文關鍵詞: | Keyword spotting, one stage dynamic programming algorithm, Hidden Markov models, syllable lattice structure |
相關次數: | 點閱:3 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
摘 要
關鍵詞辨認在語音辨認的領域中,是屬於比較特殊的一種應用。在某些應用上,只需要用到少數特定的詞彙,因此可以不用將整句話都辨認出來,只要將所需的關鍵詞辨認出來就能達到使用的目的。在本論文中,將探討多關鍵詞文句的辨認方法。
辨認核心方面是基於連續語音的技術來擷取關鍵詞。採用連續型隱藏式馬可夫模型(Continuous Hidden Markov Model)來建立國語音節模型。進行關鍵詞辨認時是採用雙層架構,第一層利用一階動態規劃演算法(One stage dynamic programming algorithm)對每一個音節找出最佳前N個候選音節。第二層再利用第一層所得到的音節配合事先定義好的辭典來擷取關鍵詞。並加入擴充辭典模型和放寬長詞限制等條件來增進關鍵詞的擷取率。
我們辨認的是『電影院名稱』、『影片名稱』和『時間』三組關鍵詞。使用擴充後的辭典加上放寬長詞限制可降低錯誤率約20個百分點。因此使用擴充後的辭典和放寬長詞限制可以在第二層時彌補第一層辨認時所造成的錯誤。在候選音節數為12的情況下,雙關鍵詞的平均錯誤率是19.67%,若不考慮『時間』錯誤率可達10%。三關鍵詞的實驗中同時擷取三個關鍵詞的錯誤率是33%,得到兩個以上關鍵詞的錯誤率是14%,至少得到一個關鍵詞的錯誤率可以降至0%。在以『是』和『不是』為關鍵詞的實驗中,錯誤率可達2%。
除了實驗之外,也建立了一個電影語音自動售票系統,以驗證其實用性。
【1】 J.G. Wilpon, L.R. Rabiner, C.H. Lee, E.R. Goldmn, “Automatic recognition of keyword in unconstrained speech using hidden Markov models”, IEEE Trans. Acoustic, Speech, Signal Proc.,vol.38, no.11 pp.1870-1878, NOV 1990
【2】 C.H. Wu, “Subsyllable-based discriminative segmental Baysian network for Mandarin speech keyword spotting”,IEE Proceedings- Vision, Image and Signal Processing, Volume:144 Issue:2 ,April 1997
【3】 杜勇賜,”口語國語中關鍵詞擷取技術之初步研究”,國立台灣大學碩士論文,1996
【4】 陳志豪,”利用411音填充模型之關鍵詞辨認系統”,國立交通大學碩士論文,1998
【5】 詹豐懋,”利用國語411音間之混淆量測之關鍵詞辨認方法”,國立交通大學碩士論文,1999
【6】 林家賢,”以音節格狀搜尋法作中文語音關鍵詞之辨認”,國立清華大學碩士論文,2000
【7】 鄭漢銘,”關鍵詞辨認系統的研製”,國立清華大學碩士論文,1996
【8】 鍾慧真,”關鍵詞語音辨認方法之改進”,國立清華大學碩士論文,1999
【9】 簡忠弘,”關鍵詞辨認系統的研究與實現”,國立清華大學碩士論文,1997
【10】 陳科旭,”使用右文相關聲韻母模式之國語關鍵詞辨認”,國立交通大學碩士論文,2000
【11】 謝華君,”電話網路上國語連續音節辨認的初步研究”,國立清華大學碩士論文,1997
【12】 徐志文,”國語關鍵詞擷取與發音確認之研究 ”,國立台灣大學碩士論文,2000
【13】 H. Ney,”The use of a one stage dynamic programming algorithm for connected word recognition”,IEEE Trans. Acoustic, Speech, Signal Proc., vol.32, no.2, April 1984
【14】 Lawrence Rabiner and Biing-Hwang Juang,”Fundamental of speech recognition”,Prentice Hall 1993
【15】 John R. Deller, Jr., John G. Proakis, John H.L.Hansen, ”Discrete-Time Processing of Speech Signals”, 1987
【16】 Jurgen Schurmann, “Pattern Classification : A Unified View of Statistical and Neural Approachs” , 1996
【17】 R.C.Rose & D.B.Paul, “A hidden Markov model based keyword recognition system” , ICASSP 1990
【18】 H.Bourland, B.D’hoore, J.M. Boite & M.Haesen “A new approach towards keyword spotting ” EUROSPEECH 1993
【19】 J.R.Rohlicek, W.Russel, S.Roukos, H.Gish, “ Continuous hidden Markov modeling for speaker-independent word spotting ” ICASSP 1989
【20】 L. R. Rabiner and R. W. Schafer, “ Digital Processing of Speech Signals “ , Prentice Hall 1978
【21】 Rachida El Meliani , “ New Efficient Fillers For Unimited Word Recognition And Keyword Spotting “ , ICSLP 1996