研究生: |
謝明峰 |
---|---|
論文名稱: |
使用大量語料庫的中文語音合成系統實作 |
指導教授: | 張智星 |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 資訊工程學系 Computer Science |
論文出版年: | 2004 |
畢業學年度: | 92 |
語文別: | 中文 |
論文頁數: | 39 |
中文關鍵詞: | 語音合成 、大量語料庫 |
外文關鍵詞: | Text-to-speech, Corpus-based |
相關次數: | 點閱:64 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
本論文主要在討論使用大量語句的聲音檔來做語音合成的方法。我們對一般的中文語音合成系統的三大部分:文句分析、韻律產生器、語音合成器加以實作並對語音合成器的部分加以比較。另外,有別於一般傳統的使用單音節來做語音合成的做法,我們同時建構了一個使用411個音節來做合成語料的單音節語音合成系統,和使用許多語音文句語音檔中,取出相同的片段來接合的大量語料庫語音合成系統。並且拿這二個系統來做分析比較。
而使用大量語料庫的語音合成系統時,要面對的困難主要有下列二點,本論文也提出相對應的解決方法:
第一、輸入文句和大量語料庫中的文句比對
輸入文句時,和大量語料庫中文句要加以比對,來找出相同的文字來做合成的語料,但比對起來較為費時。本論文使用反轉檔和最長連續詞數表,可以降低比對時間。
第二、片段與片段之間韻律參數不穩定
從不同語句所取出的片段語音檔來加以接合,因為韻律參數的不一致,會使聽者明顯感覺不自然。本論文也調整各個韻律參數,並選出較合適的語料來合成,可以降低這種情形發生。
使用大量語料庫的語音合成系統在經過語音調整之後,和原來的單音節系統來比較起來雖然使用大量語料庫的合成系統雖還有改進的空間,不過也較單音節語料庫的合成音還流暢,也不失為另一種可行的語音合成方式。
魯弘茂,中文語音合成技術之實作與分析,交通大學碩士論文,民國91年6月
鍾綸,用於語音合成的中文斷詞分析,清華大學碩士論文,民國93年6月
S. Haykin,”Neural Networks – A Comprehensive Foundation,” Macmillan College Publishing Company, 1994
F. Charpentier and Moulines, “Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones,” European Conf. On Speech Communication and Technology, pp.13-19, Paris, 1989
王鴻彬,國語聲訊處理,交通大學碩士論文,民國85年6月
邵芳雯,國語歌曲之合成,交通大學碩士論文,民國83年6月
Werner Verhelst and Mark Roelands“An Overlap-Add Technique Based on Waveform Similarity For High Quality Time-Scale Modification of Speech” In Proc. International Conference on Acoustics, Speech and Signal Processing, pages 554--557, Minneapolis, USA, apr #"27--30 1993