簡易檢索 / 詳目顯示

研究生: 黃武顯
Wu-Xian Huang
論文名稱: 基於32位元整數運算處理器之華語語音評分的改良與研究
A Study on Improving Spoken Mandarin Assessment over 32-bit Fixed-point processors
指導教授: 張智星
Jyh-Shing Roger Jang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2007
畢業學年度: 95
語文別: 中文
論文頁數: 27
中文關鍵詞: 整數定點數華語語音評分
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  •   最近幾年開始,世界各地開始有一股學習中文的熱潮。各種中文學習的書籍或是課程不斷地問市,使得中文學習的市場非常的熱絡。相較於有關英文學習的電腦軟體隨處可見,有關中文學習的電腦軟體在市面上卻不多見,可隨身攜帶學習的中文口語學習機更是非常少見。本實驗室已將基於定點數的語音辨識系統,修改成為能夠在嵌入式系統上運作,且基於定點數運算的語音評分系統。但此語音評分系統的得分結果並不是十分客觀,且有評分執行速度太慢等問題。我們希望能針對此系統的問題進行研究,並且找出可行的辦法,希望能夠使得執行速度加快,且評分的結果能夠更加正確。
      本論文以基於在嵌入式系統平台上運作的定點數運算之語音評分系統,觀察並研究評分系統所得出的評分錯誤結果資料,並根據這些觀察結果,設定條件來進行分數的調整,希望經過調整後的得分,能夠更加客觀而讓使用者能夠接受,使得系統的評分準確度能夠更高。另外在不改變系統核心下,加入額外的處理,使得評分的執行速度能夠加快。


    This thesis explores the possibility of improving the performance of our Mandarin speech assessment systems on 32-bit fix-point platform.
    For improving efficiency, we have proposed several methods for reduce computation, such that the response time of the system can be as short as possible without degrading its performance.
    For improving effectiveness, we have also proposed four score-correction rules that can be used to give a more consistent scores of speech assessment. We have implemented these methods and rules on a PMP (personal media player) based Mandarin speech assessment system with satisfactory performance both in efficiency and effectiveness.

    摘要 II ABSTRACT III 圖形目錄 VI 表格目錄 VII 第1章 緒論 1 1.1 研究主題 1 1.2 語音評分系統簡介 2 1.3 論文研究方向和主要成果 2 1.4 章節概要 3 第2章 評分計算方式介紹 4 第3章 加速方法及分數調整方法介紹 6 3.1 加速方法 6 3.2 分數調整方法 8 3.2.1 音節之音框個數差距的比較 8 3.2.2 音節中個別音素之音框個數的比較 10 3.2.3 靜音部份之音框個數的比較 11 3.2.4 整句之音節個數 12 第4章 實驗數據及分析 15 4.1 執行速度實驗 16 4.2 分數調整方法之分數門檻值及誤判率實驗 18 4.3 四種分數調整方法被使用次數的比較 22 第5章 結論及未來工作 24

    【1】 Chun-Yi Lee, Jyh-Shing Roger Jang, “Speech Evaluation”, NTHU Master Thesis, July 2002
    【2】 Jui-Lin Lo, Jyh-Shing Roger Jang, “Automatic Speech Analysis for Computer Assisted Spoken English Learning”, NTHU Master Thesis, July 2004
    【3】 Po-Chien Hsueh, Jyh-Shing Roger Jang, “Embedded Speech Recognition”, NTHU Master Thesis, July 2004
    【4】 Chin-Lung Hart Su, Jyh-Shing Roger Jang, “Speech Recognition on 32-bit Fixed-point Processors: Implementation & Discussions”, NTHU Master Thesis, July 2005
    【5】 Yi-Hung Chen, Jyh-Shing Roger Jang, “Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors”, NTHU Master Thesis, July 2006
    【6】 Shiuan-Sung Lin, Jyh-Shing Roger Jang, “Optimization of Viterbi Beam Search in Speech Recognition and Multilingual Speech Recognition”, NTHU Master Thesis, July 2002
    【7】 鐘林,“漢語語音辨別說話驗證”,北京清華大學碩士論文,2002年
    【8】 Syed Mansoor Sarwar, Robert Koretsky, Syed Aqeel Sarwar, “Linux: The Textbook”, Addison Wesley, 2001
    【9】 Andy Oram, Mike Loukides, “Programming with GNU Software”, O’Reilly, 1996
    【10】 Robert Mecklenburg, “Managing Projects with GNU Make, Third Edition”, O’Reilly, 2004

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE