簡易檢索 / 詳目顯示

研究生: 謝明峰
論文名稱: 使用大量語料庫的中文語音合成系統實作
指導教授: 張智星
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2004
畢業學年度: 92
語文別: 中文
論文頁數: 39
中文關鍵詞: 語音合成大量語料庫
外文關鍵詞: Text-to-speech, Corpus-based
相關次數: 點閱:64下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  •   本論文主要在討論使用大量語句的聲音檔來做語音合成的方法。我們對一般的中文語音合成系統的三大部分:文句分析、韻律產生器、語音合成器加以實作並對語音合成器的部分加以比較。另外,有別於一般傳統的使用單音節來做語音合成的做法,我們同時建構了一個使用411個音節來做合成語料的單音節語音合成系統,和使用許多語音文句語音檔中,取出相同的片段來接合的大量語料庫語音合成系統。並且拿這二個系統來做分析比較。
      而使用大量語料庫的語音合成系統時,要面對的困難主要有下列二點,本論文也提出相對應的解決方法:
    第一、輸入文句和大量語料庫中的文句比對
      輸入文句時,和大量語料庫中文句要加以比對,來找出相同的文字來做合成的語料,但比對起來較為費時。本論文使用反轉檔和最長連續詞數表,可以降低比對時間。
    第二、片段與片段之間韻律參數不穩定
      從不同語句所取出的片段語音檔來加以接合,因為韻律參數的不一致,會使聽者明顯感覺不自然。本論文也調整各個韻律參數,並選出較合適的語料來合成,可以降低這種情形發生。
      使用大量語料庫的語音合成系統在經過語音調整之後,和原來的單音節系統來比較起來雖然使用大量語料庫的合成系統雖還有改進的空間,不過也較單音節語料庫的合成音還流暢,也不失為另一種可行的語音合成方式。


    第一章 緒論 - 1 - 1.1研究動機 - 1 - 1.2系統簡介 - 2 - 1.3章節大綱 - 3 - 第二章 語音合成系統介紹 - 4 - 2.1國語的語音組成 - 4 - 2.2 文句分析 - 6 - 2.2.1 詞庫 - 7 - 2.2.2 斷詞原則 - 7 - 2.3 韻律產生器 - 8 - 2.3.1 類神經網路韻律產生器 - 8 - 2.3.2 輸入參數 - 10 - 2.3.3 輸出參數 - 12 - 2.3.4 實驗結果 - 14 - 2.4 語音韻律常數的調整 - 16 - 2.4.1 調整音調 - 17 - 2.4.2 調整聲音大小 - 18 - 2.4.3 調整音長 - 18 - 第三章 大量語料庫合成系統優缺點 - 21 - 3.1 大量語料庫的合成系統介紹 - 21 - 3.2 大量語料庫的合成系統所遇到的困難 - 22 - 3.3 大量語料庫多寡的影響 - 24 - 3.4 大量語料庫合成系統欲改進的方向 - 24 - 第四章 改進大量語料庫語音合成系統 - 26 - 4.1 搜尋大量語料庫的目標 - 26 - 4.2 比對演算法討論 - 26 - 4.3 建立最長連續詞數表 - 29 - 4.4 比對時間實驗討論 - 31 - 4.5 片段接合語音合成音質分析 - 32 - 4.6 改進片段接合的方向 - 33 - 4.7 實驗比較 - 34 - 第五章 結論與未來工作 - 37 - 參考文獻 - 39 -

    魯弘茂,中文語音合成技術之實作與分析,交通大學碩士論文,民國91年6月
    鍾綸,用於語音合成的中文斷詞分析,清華大學碩士論文,民國93年6月
    S. Haykin,”Neural Networks – A Comprehensive Foundation,” Macmillan College Publishing Company, 1994
    F. Charpentier and Moulines, “Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones,” European Conf. On Speech Communication and Technology, pp.13-19, Paris, 1989
    王鴻彬,國語聲訊處理,交通大學碩士論文,民國85年6月
    邵芳雯,國語歌曲之合成,交通大學碩士論文,民國83年6月
    Werner Verhelst and Mark Roelands“An Overlap-Add Technique Based on Waveform Similarity For High Quality Time-Scale Modification of Speech” In Proc. International Conference on Acoustics, Speech and Signal Processing, pages 554--557, Minneapolis, USA, apr #"27--30 1993

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE