研究生: |
鄒銘軒 Ming-Xian Zou |
---|---|
論文名稱: |
合併分類器用於哼唱選歌的研究 Query by singing/humming using combination of classifiers |
指導教授: |
張智星
Jyh-Shing Roger Jang |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 資訊工程學系 Computer Science |
論文出版年: | 2008 |
畢業學年度: | 96 |
語文別: | 中文 |
論文頁數: | 36 |
中文關鍵詞: | 旋律辨識 |
相關次數: | 點閱:1 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
合併分類器(Combination of Classifiers)主要用於統整多筆有分類的資料,並從中計算出一個新的分類結果,使其最符合各種資料的分類結果。而旋律辨識則是以人聲哼唱旋律的方式,從已知的資料庫中找出正確的歌曲。現今已經有了許多種的旋律辨識的方法,而各種旋律辨識的方法也擁有各自的特性,如以動態時間伸縮(dynamic time warping,DTW)進行辨識的結果,通常需較長的時間,但卻有較高的辨識率,而線性縮放(linear-scaling,LS),則速度較快,但相對於DTW辨識率則通常較差。而由於各種辨識方法有其不同的特性,因此其挑選出的歌曲也不盡相同。因此會出現某些的哼唱歌曲,使用某種辨識方法得到的辨識率比較好的情形。
本篇論文的重點在於,從合併分類法的角度,將旋律辨識的方法視為分類器,而其計算結果則視為分類器的分類結果,以達到整合各種旋律辨識的效果,因此,不同於旋律辨識的相關研究,本篇論文只注重於各種辨識方法的辨識結果,而不需考慮其辨識特性,其優點在於我們可以根據同一筆資料的不同排序結果,直接挑選出最好的辨識結果。
在實驗的部分,我們採用了兩組資料庫進行實驗,而根據實驗的結果,皆顯示兩組資料的辨識率皆可提升,然而都還是有無法突破的上界。因此在錯誤分析的部分,提出了一些無法被合併分類法所克服的類型。另一方面,也對於旋律辨識的兩種整合方式做比較,並做出結論。最後我們根據此結論,擷取兩種辨識方法的優點,並提出新的旋律辨識合併法(Combination of Melody Recognition)。
[1]
李念容, 張智星,"哼唱檢索的辨識方法改進及探討A Study on Improving the Methods for Querying by Singing/Humming"(2007)
[2]
Jean-Charles de Borda, Memoire sur les elections au scrutin, Historie de l’Academie Royale des Sciences, Paris (1781).
[3]
J. R. Parker, “Rank and response combination from confusion matrix data” (2000).
[4]
Jean-Francois Pessiot, Tuong-Vinh Truong, Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. “Learning to Rank for Collaborative Filtering” (2007)
[5]
王儀蓁,張智星,"旋律辨識系統之設計:限制回應時間之效能最佳化Melody Recognition System Design:Performance Optimization with Constrained Response Time"(2005)
[6]
Eunju Kim, Wooju Kim, Yillbyung Lee, “Combination of multiple classifiers for the customer’s purchase behavior prediction” (2002)
[7]
Chris Burges, Tal Shaked, Erin Renshaw, Ari Lazier, Matt Deeds, Nicole Hamilton, Greg Hullender, “Learning to Rank using Gradient Descent”(2005)