多關鍵詞文句之辨認方法｜國立清華大學博碩士論文庫

簡易檢索 / 詳目顯示

回結果列表

研究生：	劉佑德 You-Te Liu
論文名稱：	多關鍵詞文句之辨認方法 Keyword Spotting for Multi-keyword Sentences
指導教授：	王小川博士 Prof. Hsiao-Chuan Wang
口試委員:
學位類別：	碩士 Master
系所名稱：	電機資訊學院 - 電機工程學系 Department of Electrical Engineering
論文出版年：	2001
畢業學年度：	89
語文別：	中文
論文頁數：	55
中文關鍵詞：	關鍵詞、一階動態規劃演算法、隱藏式馬可夫模型、辭典擴充、放寬長詞限制、音節格狀輸出
外文關鍵詞：	Keyword spotting, one stage dynamic programming algorithm, Hidden Markov models, syllable lattice structure
相關次數：	點閱：70 下載：0
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

摘要
關鍵詞辨認在語音辨認的領域中，是屬於比較特殊的一種應用。在某些應用上，只需要用到少數特定的詞彙，因此可以不用將整句話都辨認出來，只要將所需的關鍵詞辨認出來就能達到使用的目的。在本論文中，將探討多關鍵詞文句的辨認方法。

辨認核心方面是基於連續語音的技術來擷取關鍵詞。採用連續型隱藏式馬可夫模型（Continuous Hidden Markov Model）來建立國語音節模型。進行關鍵詞辨認時是採用雙層架構，第一層利用一階動態規劃演算法（One stage dynamic programming algorithm）對每一個音節找出最佳前N個候選音節。第二層再利用第一層所得到的音節配合事先定義好的辭典來擷取關鍵詞。並加入擴充辭典模型和放寬長詞限制等條件來增進關鍵詞的擷取率。

我們辨認的是『電影院名稱』、『影片名稱』和『時間』三組關鍵詞。使用擴充後的辭典加上放寬長詞限制可降低錯誤率約20個百分點。因此使用擴充後的辭典和放寬長詞限制可以在第二層時彌補第一層辨認時所造成的錯誤。在候選音節數為12的情況下，雙關鍵詞的平均錯誤率是19.67%，若不考慮『時間』錯誤率可達10%。三關鍵詞的實驗中同時擷取三個關鍵詞的錯誤率是33%，得到兩個以上關鍵詞的錯誤率是14%，至少得到一個關鍵詞的錯誤率可以降至0%。在以『是』和『不是』為關鍵詞的實驗中，錯誤率可達2%。

除了實驗之外，也建立了一個電影語音自動售票系統，以驗證其實用性。

第一章 緒論……………………………………………1
1.1 研究動機…………………………………………1

1.2 國語語音的特性…………………………………2

1.3 關鍵詞辨認的特性………………………………3

1.4 相關研究…………………………………………4

1.5 研究方向…………………………………………5

1.6 章節概要…………………………………………6

第二章 語音辨認的基本技術…………………………7

2.1 語音特徵參數的萃取……………………………8

2.2 隱藏式馬可夫模型………………………………13

2.3 連續語音的辨認方法……………………………17

2.4 通道效應的補償…………………………………23

2.5 基於連續語音辨認技術之關鍵詞擷取…………26

第三章 實驗結果與分析………………………………34

3.1 語音資料庫簡介…………………………………34

3.2 關鍵詞辨認實驗…………………………………36

3.2.1 單一關鍵詞實驗………………………………36

【實驗3.1】辭典擴充的影響..………………………36

【實驗3.2】放寬長詞的限制…………………………40

3.2.2 多關鍵詞實驗…………………………………42

【實驗3.3】雙關鍵詞實驗……………………………42

【實驗3.4】三關鍵詞實驗……………………………43

3.2.3 『是』與『不是』為關鍵詞之辨認…………44

【實驗3.5】以『是』和『不是』為關鍵詞之實驗…44

3.2.4 非關鍵詞的拒絕能力…………………………46

【實驗3.6】非關鍵詞的拒絕能力……………………46

第四章 線上即時展示系統的製作……………………48

4.1 線上即時展示系統之架構………………………49

4.2 線上即時展示系統之運作流程…………………50

第五章 結論…………………………………………52

參考文獻………………………………………………53

【1】 J.G. Wilpon, L.R. Rabiner, C.H. Lee, E.R. Goldmn, “Automatic recognition of keyword in unconstrained speech using hidden Markov models”, IEEE Trans. Acoustic, Speech, Signal Proc.,vol.38, no.11 pp.1870-1878, NOV 1990
【2】 C.H. Wu, “Subsyllable-based discriminative segmental Baysian network for Mandarin speech keyword spotting”,IEE Proceedings- Vision, Image and Signal Processing, Volume:144 Issue:2 ,April 1997
【3】杜勇賜，”口語國語中關鍵詞擷取技術之初步研究”，國立台灣大學碩士論文，1996
【4】陳志豪，”利用411音填充模型之關鍵詞辨認系統”，國立交通大學碩士論文，1998
【5】詹豐懋，”利用國語411音間之混淆量測之關鍵詞辨認方法”，國立交通大學碩士論文，1999
【6】林家賢，”以音節格狀搜尋法作中文語音關鍵詞之辨認”，國立清華大學碩士論文，2000
【7】鄭漢銘，”關鍵詞辨認系統的研製”，國立清華大學碩士論文，1996
【8】鍾慧真，”關鍵詞語音辨認方法之改進”，國立清華大學碩士論文，1999
【9】簡忠弘，”關鍵詞辨認系統的研究與實現”，國立清華大學碩士論文，1997
【10】陳科旭，”使用右文相關聲韻母模式之國語關鍵詞辨認”，國立交通大學碩士論文，2000
【11】謝華君，”電話網路上國語連續音節辨認的初步研究”，國立清華大學碩士論文，1997
【12】徐志文，”國語關鍵詞擷取與發音確認之研究 ”，國立台灣大學碩士論文，2000
【13】 H. Ney，”The use of a one stage dynamic programming algorithm for connected word recognition”，IEEE Trans. Acoustic, Speech, Signal Proc., vol.32, no.2, April 1984
【14】 Lawrence Rabiner and Biing-Hwang Juang，”Fundamental of speech recognition”，Prentice Hall 1993
【15】 John R. Deller, Jr., John G. Proakis, John H.L.Hansen, ”Discrete-Time Processing of Speech Signals”, 1987
【16】 Jurgen Schurmann, “Pattern Classification : A Unified View of Statistical and Neural Approachs” , 1996
【17】 R.C.Rose & D.B.Paul, “A hidden Markov model based keyword recognition system” , ICASSP 1990
【18】 H.Bourland, B.D’hoore, J.M. Boite & M.Haesen “A new approach towards keyword spotting ” EUROSPEECH 1993
【19】 J.R.Rohlicek, W.Russel, S.Roukos, H.Gish, “ Continuous hidden Markov modeling for speaker-independent word spotting ” ICASSP 1989
【20】 L. R. Rabiner and R. W. Schafer, “ Digital Processing of Speech Signals “ , Prentice Hall 1978
【21】 Rachida El Meliani , “ New Efficient Fillers For Unimited Word Recognition And Keyword Spotting “ , ICSLP 1996

全文公開日期本全文未授權公開 (校內網路)
全文公開日期本全文未授權公開 (校外網路)
全文公開日期本全文未授權公開 (國家圖書館：臺灣博碩士論文系統)

簡易檢索 / 詳目顯示

相關論文