簡易檢索 / 詳目顯示

研究生: 徐茂原
論文名稱: 國語歌曲的歌聲合成之自然度改良與研究
指導教授: 張智星
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2004
畢業學年度: 92
語文別: 中文
論文頁數: 22
中文關鍵詞: 歌聲合成
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 在本論文中,討論了如何使的合成的歌聲更接近真人歌唱,並且在其音質上加以改進。在音質上,我們嘗試了使用對於時域與對於頻域作音高語音長調校的不同方法。在音高的調整上包涵了Multirate,phase vocoder,PSOLA等等方法,同時在音長的改變上我們則嘗試了PSOLA,phase vocoder,WSOLA幾個方向。並且在論文中說明了何以在最後的系統中決定使用何種方法作為依歸的準則。除此之外,在自然度的方面,我們加入了音量的考量,音高遞嬗的平滑化,轉折音,抖音等等部份的模擬。我們也利用multirate的方式作男聲女聲的轉換,經由這樣的轉換可以製造出男女合唱或對唱的特殊效果。
    歌聲合成到目前為止還是一項未臻於完美的技術。並不僅只是如何合成岀完美的音質這個問題而已。如何使電腦能夠合成岀接近真人,令人真假莫辯的歌聲仍然是個問題。許多的歌唱技巧在實作上都仍然有其困難性。可以參考的一個方向是如何加入樂理的考量,或者是利用大量的歌聲資料經過訓練後得到某一特定的歌唱模式。雖然如此,接近真人歌唱歌聲合成確實是一項有趣的課題,他的娛樂性與市場性將在可見的未來展現無窮的潛力,比如說自動歌聲矯正,或者虛擬歌手,或者是能夠模仿某特定歌手唱歌的玩具等等。這當然是個美麗的願景,而這個願景相信在不遠的未來可以得到實現。


    第一章 導論 1.1 研究動機…………………………………………………………………1 1.2 研究方向…………………………………………………………………1 1.3 相關研究…………………………………………………………………1 第二章 歌聲合成相關方法 2.1 音高調整   2.1.1 Multirate………………………………………………………………2 2.1.2 PSOLA………………………………………………………………...2 2.1.3 Phase vocoder…………………………………………………………4 2.2 音長調整 2.2.1 線性內插……………………………………………………………..5 2.2.2 WSOLA 相似波形疊加法…………………………………………...6 第三章 模擬真人歌唱 3.1 緒論……………………………………………………………………….8 3.2抖音………………………………………………………………………..8 3.3 音量調整………………………………………………………………….9 3.4 轉折音……………………………………………………………………12 3.5 音高曲線平滑化…………………………………………………………13 第四章 系統簡介與實驗結果 4.1 系統簡介…………………………………………………………………14 4.2 實驗結果…………………………………………………………………15 第五章 結論與未來工作…………………………………………………………...20 參考文獻

    參考文獻
    1 Alan V. Oppenheim and Ronald W. Schafer, “Discrete-Time Signal Processing”, Prentice Hall, 1989.
    2 F. Charpentier and Moulines, “Pitch-synchronous Waveform Processing Technique for Text-to-Speech Synthesis Using Diphones,” European Conf. On Speech Communication and Technology, pp.13-19, Paris, 1989.
    3 An Overlap-add Technique Based on Waveform Similarity For High Quality Time Scale Modification of Speech , Werner Verhelst and Marc Roelands ,Vrije University Brussels ,Belgium
    4 C. Hamon and E. Mouline and F. Charpentier , “A diphone synthesis system based on time-domain prosodic modifications of speech”, Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 1989 International Conference on , 1989 , Page(s): 238 -241 vol.1
    5 John R.Deller, John G. Proakis, John HL Hansen “Discrete-Time Processing of Speech Signals” Prentice Hall, 1993, p236-250
    6 New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing, and other Exotic Effects. J. Laroche and M. Dolson. (1999). Proc. IEEE ASSP Workshop on app. of sig. proc. to audio and acous..
    7 J. Laroche and M. Dolson,. (1997). Phase-vocoder: About this phasiness business. Proc. IEEE ASSP Workshop on app. of sig. proc. to audio and acous.
    8 H. Valbret and E. Moulines and J.P. Tubach, “Voice transformation using PSOLA technique” , Acoustics, Speech, and Signal Processing, 1992. ICASSP-92, 1992 IEEE International Conference on Volume: 1 , 1992 , Page(s): 145 -148 vol.
    9 國語歌曲之合成,交通大學碩士論文,民國83年 -- 邵芳雯即時歌唱聲合成系統與音樂合成系統
    10 國語歌曲的合成與實作,清華大學碩士論文,民國90年 --林政源
    11 即時歌唱聲合成系統與音樂合成系統之整合,台灣科技大學碩士論文,民國91年 --盛思豪
    12 合成歌聲,臺灣大學碩士論文,民國92年 --歐婉菁

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE