簡易檢索 / 詳目顯示

研究生: 鄭琇云
Shiu-Yun Cheng
論文名稱: 各種音高追蹤方法對哼唱選歌之影響的評估
An Evaluation of Query By Singing/Humming Based on Various Pitch Trackiing Methods
指導教授: 張智星
Jyh-Shing Roger Jang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2008
畢業學年度: 96
語文別: 中文
論文頁數: 40
中文關鍵詞: 音高追蹤哼唱選歌
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 音高(Pitch) 代表聲音頻率的高低,是音訊處理上一個相當重要的特徵,也是人判斷聲音種類、內容的依據之一。一段穩定的聲音,其音訊的波形通常會有週期性,即存在一個基本週期。而一般使用聲音的基本頻率(Fundamental Frequency)來類比,即基本週期(Fundamental Period)的倒數。而如何以電腦自動抓取一段音訊的音高,其過程便稱為音高追蹤(Pitch Tracking)。
    本論文將簡要敘述九種不同音高追蹤方法之內容:HPS、SHS、SHR、Cepstrum、ACF、AMDF、SWIPE’、Dressler’s algorithm、UPDUDP,列出其分析音訊求取音高的步驟。在實驗一中,以八種音高追蹤方法:HPS、SHS、Cepstrum、ACF、AMDF、SWIPE’、Dressler’s algorithm、UPDUDP,分別對所蒐集的錄音檔進行音高追蹤求出音高,並與人工標示之音高進行比對,計算出辨識率。接著在實驗二中,本論文以LS及兩種DTW方法來進行旋律辨識,比較此八種音高追蹤方法得到之音高資訊與人工標示音高進行旋律辨識結果之差異。
    根據實驗結果,音高追蹤結果以UPDUDP的辨識率為最高。而旋律辨識結果以UPDUDP進行音高追蹤,以LS進行旋律辨識之辨識率為最高,與人工標示音高之辨識結果相比只差了2.16%。
    最後,本論文將針對各音高追蹤方法之辨識結果進行分析,並比較其優缺點。


    目錄 第1章 緒論 1 1.1 簡介 1 1.2 相關研究 1 1.3 本論文主要成果 2 1.4 章節概述 2 第2章 音高追蹤的方法 3 2.1 HPS (Harmonic Product Spectrum) 3 2.2 SHS (Sub-Harmonic Summation) 5 2.3 SHR (Subharmonic-to-Harmonic Ratio) 6 2.4 Cepstrum 7 2.5 SWIPE’ (Sawtooth Waveform Inspired Pitch Estimator) 8 2.6 Dressler’s algorithm 11 2.7 ACF (Autocorrelation Function) 11 2.8 AMDF (Average Magnitude Difference Function) 13 2.9 UPDUDP (Unbroken Pitch Determination Using Dynamic Programming) 14 第3章 實驗與錯誤分析 17 3.1 實驗環境 17 3.2 實驗一:針對540個中華電信錄音檔案進行音高追蹤 17 3.2.1 實驗步驟 17 3.2.2 實驗結果 18 3.3 實驗二:針對139個中華電信錄音檔案作旋律辨識 20 3.3.1 實驗步驟 20 3.3.2 實驗結果:音高追蹤 21 3.3.3 實驗結果:旋律辨識 22 3.4 錯誤分析 23 3.4.1 不同音高追蹤方法的錯誤類型 23 3.4.2 影響音高追蹤及旋律辨識之辨識率的其他因素 35 第4章 結論與未來工作 38 參考文獻 40

    【1】 Jiang-Chun Chen, J.-S. Roger Jang, "TRUES: Tone Recognition Using Extended Segments", ACM Transactions on Asian Language Information Processing, 2008.
    【2】 Arturo Camacho, “SWIPE: A Sawtooth Waveform Inspired Pitch Estimator for Speech and Music”, PhD. Thesis, University of Florida, 2007.
    【3】 K. Dressler, “An Auditory Streaming Approach on Melody Extraction”, in 2nd Music Information Retrieval Evaluation eXchange (MIREX), 2006
    【4】 K. Dressler, “Extraction of the Melody Pitch Contour from Polyphonic Audio”, Proceeding of the 2005 Music Information Retrieval eXchange(MIREX), 2005
    【5】 X. Sun, “A Pitch Determination Algorithm Based on Subharmonic-Harmonic Ratio”, Proceedings of the 6th International Conference on Spoken Language Processing, Beijing, China, 2000
    【6】 Dik Hermes, “Measurement of Pitch by Subharmonic Summation”, Journal of Acoustic of Society of America, 1988
    【7】 L. R. Rabiner, “On the Use of Autocorrelation Analysis for Pitch Detection”, IEEE Transactions on Acoustics, Speech and Signal Processing, 1977
    【8】 M. J. Ross, H. L. Shaffer, A. Cohen, R. Freudberg, and H. J. Manley, “Average Magnitude Difference Function Pitch Extractor”, IEEE Transactions on Acoustics, Speech and Signal Processing, 1974
    【9】 M. R. Schroeder, “Period Histogram and Product Spectrum: New Methods for Fundamental Frequency Measurement”, Journal of the Acoustical Society of America, 1968
    【10】 A. M. Noll, “Cepstrum Pitch Determination”, Journal of the Acoustical Society of America, 1967

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE