簡易檢索 / 詳目顯示

研究生: 鍾鎧鴻
Chung, Kai-Hung
論文名稱: 台語 前音節 後音節 的 分割及合成
The Segmentation and Synthesis of Front Syllables and Back Syllables in Taiwanese
指導教授: 江永進
Chiang, Yuang-Chin
口試委員: 江永進
呂仁園
高明達
學位類別: 碩士
Master
系所名稱: 理學院 - 統計學研究所
Institute of Statistics
論文出版年: 2013
畢業學年度: 101
語文別: 中文
論文頁數: 67
中文關鍵詞: 同母音疊合前音節後音節音節分段
外文關鍵詞: same vowel overlap and add, front syllabels, back syllabels, segmentation of syllabels
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 在語音合成時, 將 前音後 與 後音前 相同的母音 做疊合 的方法, 稱為 同母音疊合(same vowel overlap and add, SVOLA), 使用 同母音疊合 的方式, 就可以 利用 基礎音節 去合成出 所有的聲調, 但 同母音疊合時, 會遇到 前音節的 前音前與前音後 該切在何處的問題。 本論文的 目標 就是去尋找 前音前與前音後 的切割點, 為了做 音節的分段,我們 使用四種 不同的 音節分段的方法:獨立音框的 最大概似 標籤、不用 訓練資料的 最大 分段總概似 的 切割法、使用 訓練資料的 最大 分段總概似 的 切割法 或 VDS 數列切割法 去對 音節做分段, 其中 VDS 數列切割法 可以 很有效的 切割 前音前 與 前音後 。


    Given two simple syllables with a common vowel in them, we find that a new quite intelligible syllable can be synthesized by splitting the two syllables at this common vowel, and then concatenate the first part of the first syllable and the second part of second syllable. We call these two simple syllables front syllable and back syllable respectively, and call this method SVOLA, or “same vowel overlap and add” syllable synthesis. With a somewhat minimal set of front and back syllables as basis, a Taiwanese syllable synthesis system can be built easily using SVOLA. In addition to implement such a synthesis system, this thesis also explores four methods of splitting of the basis syllables. The first is independent frame maximum log-likelihood. The second is maximum segmental total likelihood without training data. The third is maximum segmental total likelihood with training data. For the fourth method we transform the feature vectors into a DS matrix (smoothing and then taking difference), and we split the basis syllable using the VDS sequence, or the sequence of the column variances of the DS matrix. The VDS approach is more effective in splitting the front syllables.

    第一章 概論 1 第二章 聲韻系統 3 2.1 台語音韻 簡介 3 2.2 台語的錄製與合成 4 第三章 聲學的特徵參數 7 3.1 聲學語音學 7 3.2 聲波的特徵參數 13 3.3 本論文參數設定 23 第四章 音框的獨立分類法 26 4.1 訓練的 基礎類別 27 4.2 Quadratic Discriminant Analysis 28 4.3 Linear Discriminant Analysis 30 第五章 音節分段的方法 33 5.1 標籤對齊 與 音段切割 33 5.2 獨立音框的 最大概似 標籤 34 5.3 最大 分段總概似:不用 訓練資料 35 5.4 最大 分段總概似:使用 訓練資料 38 5.5 小結論 40 第六 章 DS 矩 陣 、VDS 數 列 及 語 音 切割 42 第七章 實作與結果 50 7.1 參考答案的製作 50 7.2 正確率的計算 53 7.3 各方法的比較 與 結果 54 第八章 台語音節合成 57 8.1 音節合成的步驟 57 8.2 台語語音合成 實作 60 第九章 結論 61 參考文獻 63 附錄 65

    [1] 王小川 (2008). 語音訊號處理. 第三版, 2008 年, 台北:全華科技圖書股份有限公司.
    [2] 吳德祥 (2009). 台華語音節 雙拼合成. 清華大學統計學研究所學位論文, 2009 年, 1-42. 新竹:清華大學.
    [3] 陳雅婷 (2012). 使用 擴展修剪演算法 決定語音音週標記 及 在台語語音合成 的應用. 清華大學統計學研究所學位論文, (2012 年), 1-40. 新竹:清華大學.
    [4] Kumar, N., & Andreou, A. G. (1998). Heteroscedastic discriminant analysis and reduced rank HMMs for improved speech recognition. Speech communication, 26(4), 283-297.
    [5] Kortekaas, R. W., & Kohlrausch, A. (1997). Psychoacoustical evaluation of the pitch-synchronous overlap-and-add speech-waveform manipulation technique using single-formant stimuli. The Journal of the Acoustical Society of America, 101, 2202.
    [6] Verhelst, W., & Roelands, M. (1993). An overlap-add technique based on waveform similarity (WSOLA) for high quality time-scale modification of speech. In Acoustics, Speech, and Signal Processing, 1993. ICASSP-93., 1993 IEEE International Conference on (Vol. 2, pp. 554-557).
    [7] Boersma, P. (1993). Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound. In Proceedings of the institute of phonetic sciences (Vol. 17, No. 1193, pp. 97-110).
    [8] Krishnapuram, B., Carin, L., Figueiredo, M. A., & Hartemink, A. J. (2005). Sparse multinomial logistic regression: Fast algorithms and generalization bounds. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(6), 957-968.
    [9] Young, Steve J., Gunnar Evermann, M. J. F. Gales, D. Kershaw, G. Moore, J. J. Odell, D. G. Ollason, D. Povey, V. Valtchev, and P. C. Woodland (2006). The HTK book version 3.4., http://htk.eng.cam.ac.uk/download.shtml.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE