簡易檢索 / 詳目顯示

研究生: 鄒銘軒
Ming-Xian Zou
論文名稱: 合併分類器用於哼唱選歌的研究
Query by singing/humming using combination of classifiers
指導教授: 張智星
Jyh-Shing Roger Jang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 資訊工程學系
Computer Science
論文出版年: 2008
畢業學年度: 96
語文別: 中文
論文頁數: 36
中文關鍵詞: 旋律辨識
相關次數: 點閱:1下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 合併分類器(Combination of Classifiers)主要用於統整多筆有分類的資料,並從中計算出一個新的分類結果,使其最符合各種資料的分類結果。而旋律辨識則是以人聲哼唱旋律的方式,從已知的資料庫中找出正確的歌曲。現今已經有了許多種的旋律辨識的方法,而各種旋律辨識的方法也擁有各自的特性,如以動態時間伸縮(dynamic time warping,DTW)進行辨識的結果,通常需較長的時間,但卻有較高的辨識率,而線性縮放(linear-scaling,LS),則速度較快,但相對於DTW辨識率則通常較差。而由於各種辨識方法有其不同的特性,因此其挑選出的歌曲也不盡相同。因此會出現某些的哼唱歌曲,使用某種辨識方法得到的辨識率比較好的情形。
    本篇論文的重點在於,從合併分類法的角度,將旋律辨識的方法視為分類器,而其計算結果則視為分類器的分類結果,以達到整合各種旋律辨識的效果,因此,不同於旋律辨識的相關研究,本篇論文只注重於各種辨識方法的辨識結果,而不需考慮其辨識特性,其優點在於我們可以根據同一筆資料的不同排序結果,直接挑選出最好的辨識結果。
    在實驗的部分,我們採用了兩組資料庫進行實驗,而根據實驗的結果,皆顯示兩組資料的辨識率皆可提升,然而都還是有無法突破的上界。因此在錯誤分析的部分,提出了一些無法被合併分類法所克服的類型。另一方面,也對於旋律辨識的兩種整合方式做比較,並做出結論。最後我們根據此結論,擷取兩種辨識方法的優點,並提出新的旋律辨識合併法(Combination of Melody Recognition)。


    第1章 序論 6 1.1 合併分類法簡介 6 1.2 相關研究 6 1.3 本論文主要成果 7 1.4 章節概要 8 第2章 分類合併法的討論 9 2.1 根據最小名次之分析 9 2.2 加法 10 2.3 乘法 10 2.4 布達計數法(Borda Count Method) 10 2.4.1 基本概念 10 2.4.2 加權布達計數法(Weighted Borda Count Method) 11 2.4.3 布達計數法的修正(mwBorda‘s Method) 12 第3章 系統架構 14 3.1 旋律辨識的流程 14 3.2 旋律辨識的方法 14 3.2.1線性縮放(linear-scaling,LS) 14 3.2.2動態時間伸縮(dynamic time warping,DTW) 15 3.3 旋律辨識的整合 16 第4章 實驗與討論 18 4.1 實驗環境 18 4.2 實驗一:使用單一辨識方法 18 4.3 實驗二:各種合併辨識法的使用 20 4.4 平行(parallel)與序列(serial)旋律辨識的比較 23 4.5 平行式合併法的錯誤分析 26 4.6 平行式與序列式合併法的結合 27 4.7 辨識方法的計算時間比較 32 4.8 平行式與序列式合併法的優缺點 33 第5章 結論與未來工作 35 參考文獻 36

    [1]
    李念容, 張智星,"哼唱檢索的辨識方法改進及探討A Study on Improving the Methods for Querying by Singing/Humming"(2007)
    [2]
    Jean-Charles de Borda, Memoire sur les elections au scrutin, Historie de l’Academie Royale des Sciences, Paris (1781).
    [3]
    J. R. Parker, “Rank and response combination from confusion matrix data” (2000).
    [4]
    Jean-Francois Pessiot, Tuong-Vinh Truong, Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. “Learning to Rank for Collaborative Filtering” (2007)
    [5]
    王儀蓁,張智星,"旋律辨識系統之設計:限制回應時間之效能最佳化Melody Recognition System Design:Performance Optimization with Constrained Response Time"(2005)
    [6]
    Eunju Kim, Wooju Kim, Yillbyung Lee, “Combination of multiple classifiers for the customer’s purchase behavior prediction” (2002)
    [7]
    Chris Burges, Tal Shaked, Erin Renshaw, Ari Lazier, Matt Deeds, Nicole Hamilton, Greg Hullender, “Learning to Rank using Gradient Descent”(2005)

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)

    QR CODE