簡易檢索 / 詳目顯示

研究生: 陳雅婷
Chen, Ya-ting
論文名稱: 使用 擴展修剪演算法 決定語音音週標記 及 在台語語音合成的應用
A Speech Pitch Period Marking Using Extending-Trimming Algorithm with Application to Taiwanese Speech Synthesis
指導教授: 江永進
Chiang, Yuang-chin
口試委員: 江永進
呂仁園
高明達
學位類別: 碩士
Master
系所名稱: 理學院 - 統計學研究所
Institute of Statistics
論文出版年: 2012
畢業學年度: 100
語文別: 中文
論文頁數: 40
中文關鍵詞: 雙拼合成音週標記音高追蹤同母音疊合前音節後音節台語語音合成系統
外文關鍵詞: Binary combination, Pitch period marking, Taiwanese synthesis system.
相關次數: 點閱:4下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 一般音週標記(pitch period marking 語音週期標記)需要先決定音高(音高追蹤 pitch tracking, pitch determination),再計算音週標記。音週標記只是語音波形的局部最大值數列的子集合。本研究提出一個不經過音高追蹤的步驟,直接計算週期標記的方法,此方法是將音週標記當作 組合空間搜尋的 問題來處理,叫做擴展修剪演算法, 或ET演算法。 ET代表Extending 及Trimming,分別是探索組合空間的方法,以及可能性低路徑的刪減方法。所得到的音週標記,配合我們先前提出的(音節)雙拼合成方法,台語的單音節語音合成系統,可以較輕力實作。


    Speech pitch period marking usually requires pitch determination first. In this study we regard the pitch period marking as a searching problem through the combinatorial space of local maxima of a speech waveform, and propose an ET algorithm for pitch period marking without going through pitch determination. ET stands for “extending” and “trimming”; extending prescribes a way to explore the combinatorial search space, and trimming specify a way to limit the search space. With resulting pitch period marks and previously proposed binary combination method, a syllable-based Taiwanese synthesis system can be implemented with relatively little effort.

    摘要 I 第一章 概論 - 1 - 第二章 台語雙拼合成 - 2 - 2.1 台語音節雙拼教學 - 2 - 2.2 台語音節雙拼合成 - 3 - 2.3 韻律調整 - 5 - 2.3 錄製台語基礎音節 - 7 - 第三章 音高追蹤與音週標記 - 9 - 3.1 PITCH TRACKING - 9 - 3.2 PITCH PERIOD MARKING - 11 - 3.3 討論 - 11 - 第四章 擴展修剪演算法 - 12 - 4.1 擴展修剪演算法主要想法 - 12 - 4.2 修剪時之成本函數 - 15 - 4.3 ET流程 - 16 - 4.4 CANDIDATE LIST候選序列 - 19 - 4.5 本章總結 - 22 - 第五章 實作與結果 - 23 - 5.1 標準答案製作 - 23 - 5.2 ET演算法實作 - 25 - 5.3 PITCH TRACKING - 28 - 5.4 結果 - 30 - 5.5 比較TOP N中選一 - 32 - 第六章 台語語音合成上的應用 - 34 - 第七章 結論 - 37 - 參考文獻 - 38 - 附錄 - 39 - 台語雙拼合成的前音節、後音節及子音音節 - 39 -

    [1] S.J. Young(1989), "Token Passing: a Simple Conceptual Model for Connected Speech Recognition Systems", Cambridge University Engineering Department,1989.
    [2] Cheng-Yuan Lin and J.S. Roger Jang, "A Two-Phase Pitch Marking Method for TD-PSOLA Synthesis", GESTS International Transaction on Speech Science and Engineering, No. 2, Vol. 1,PP.211-221,Dec 2004.
    [3] 陳江村, "A Study on Pronunciation Assessment and Tone Recognition in Mandarin Chinese ", 新竹市:國立清華大學資訊工程學系博士論文 , 2008。
    [4] 吳德祥(2009), "台華語音節雙拼合成", 新竹市:國立清華大學統計學研究所碩士論文 ,2009。
    [5] 江永進(2009), "sipitts.exe" 私人通訊, 新竹市:國立清華大學統計學研究所 , 2009(此軟體用來音週標記之人工修正)。
    [6] 江永進(2009),"dilig.exe"「台音錄音機v1.0 beta5」私人通訊, 新竹市:國立清華大學統計學研究所 , 2009(此軟體用來錄製語音)。
    [7] 江永進(2010), "台語拼音雙拼法333",2010。
    [8] Scipy-0.10.0-python3.2(2011) http://numpy.scipy.org/
    [9] Numpy-1.6.1- python3.2(2011) http://numpy.scipy.org/
    [10] Python 3.2 (2012) http://www.python.org/
    [11] Matplotlib -python3.2(2012) http://www.lfd.uci.edu/~gohlke/pythonlibs/

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE