研究生: |
薛博謙 |
---|---|
論文名稱: |
嵌入式系統上的語音辨識 Embedded Speech Recognition |
指導教授: | 張智星 |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 資訊工程學系 Computer Science |
論文出版年: | 2004 |
畢業學年度: | 92 |
語文別: | 中文 |
論文頁數: | 32 |
中文關鍵詞: | 語音辨識 、語音特徵擷取 、加速 、嵌入式系統 |
相關次數: | 點閱:2 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
基於近年來行動運算技術日漸發達且普及,愈來愈多的行動裝置如手機和PDA 等產品,將要或已經提供了語音辨識和語音指令等相關功能,這些功能最主要的目的,通常在於讓人們的生活更方便,但是若要將它們實作在嵌入式系統上時,卻會遇到如執行速度太慢等問題。
本論文就演算法的執行速度加速為討論重點,提出了在嵌入式裝置實作出語音辨識系統的研究,並且希望在加速的同時,能顧及到整個系統最後的辨識能力。在本論文中,我將提出整數運算和查表的加速演算法,並提出數種在實作嵌入式語音辨識系統時會遇到的問題和解決辨法。
本研究分別就梅爾刻度倒頻譜參數 ( MFCC, Mel-frequency cepstral coefficient ) 和隱藏式馬可夫模型 ( HMM,Hidden Markov Model ) 的加速方法的各步驟詳細介紹,其中包涵了 FFT, Logarithm 和在整數運算中維持精準度的方法…等主題,這些演算法不只可應用在本論文的系統中,它們並且也可應用在許多其它領域的研究上。
本論文的重點為執行效能的提升,並且在效能提升的同時,希望能維持很好的準確度和辨識率,所以論文最後,提出了三項實驗,分別是:「精準度實驗」,「加速前後執行速度比較實驗」和「各項辨識率比較實驗」。由實驗的結果顯示,本研究提出的整數演算法,在特徵擷取部份,加速約有 20 倍,而辨識率約下降了 8% 左右。
1. A LOW-POWER, FIXED-POINT, FRONT-END FEATURE EXTRACTION FOR A DISTRIBUTED SPEECH RECOGNITION SYSTEM, Brian Delaney , Nikil Jayant, Mat Hans, Tajana Simunic, Andrea Acquaviva
2. CHIPDESIGN OF MFCC EXTRACTION FOR SPEECH RECOGNITION, Jia-Ching Wang, Jhing-Fa Wang*, Yu-Sheng Weng
3. REDUCING COMPUTATIONAL AND MEMORY COST FOR CELLULAR PHONE EMBEDDED SPEECH RECOGNITION SYSTEM, Christophe L´evy, Georges Linar`es, Pascal Nocera, Jean-Franc¸ois Bonastre
4. The FFT Demystified. V2.1, http://www.eptools.com/tn/T0001/INDEX.HTM
5. SPEAKER RECOGNITION WITH SMALL TRAINING REQUIREMENTS USING A COMBINATION OF VQ AND DHMM, Minh Do and Michael Wagner
6. FOURIER TRANSFORMS AND THE FAST FOURIER TRANSFORM (FFT) ALGORITHM, Paul Heckberk
7. ON DESIGN AND IMPLEMENTATION OF AN EMBEDDED AUTOMATIC SPEECH RECOGNITION SYSTEM, Sujay Phadke, Rhishikesh Limaye, Siddharth Vermam, Kavitha Subramanian.
8. A QUANTIZED FIXED-POINT FRONT-END FOR DISTRIBUTED SPEECH RECOGNITION, Laura Miyakawa, Lee Hetherington
9. FUNDAMENTALS OF SPEECH RECOGNITION, L. Rabiner, B.H.Juang.
10. WRITING EFFICIENT C FOR ARM, ARM Inc.
11. MATH TOOLKIT FOR REAL-TIME PROGRAMMING, Lawrence, Kansas