研究生: |
鍾綸 Lun Chung |
---|---|
論文名稱: |
用於語音合成的中文斷詞分析 Analysis of Chinese Word Segmentation for Text-to-speech Synthesis |
指導教授: |
張智星
Jyh-Shing Roger Jang |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
電機資訊學院 - 資訊系統與應用研究所 Institute of Information Systems and Applications |
論文出版年: | 2004 |
畢業學年度: | 92 |
語文別: | 中文 |
論文頁數: | 44 |
中文關鍵詞: | 語音合成 、斷詞 、構詞 |
外文關鍵詞: | Text-to-speech, Word-segmentation |
相關次數: | 點閱:1 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
聲音訊號處理(Audio Signal Processing) 近年成為資訊領域的另一研究焦點,無論是語音辨識或合成,都成為資訊生活化,以及改善人機介面的重要核心技術。以語音合成為例,為達成貼近自然人聲的遠程目標,如何讓機器學習、模擬人類說話的方式,如語調的變化、韻律節奏的起頓乃至文意的表達等,都是語音合成研究的重點。其中,斷詞在中文語音合成又極具影響。
在許多自然語言的研究和應用中,中文斷詞器都是不可少的前置處理。本文嘗試藉由語言學的基礎,建立一套適合中文語音合成的斷詞器。斷詞系統可略分兩大單元。其一的斷詞單元中,我們以長詞優先法(Longest Word First)及動態規劃演算法(Dynamic Programming)兩種方法,分別測試斷詞的結果。然而詞庫的匯集耗費相當地時間與人力,且龐大的詞庫對斷詞系統的整體效能更是一大負擔,考量中文構詞的特性,我們又加入構詞單元,其中包含定量複合詞構詞、疊詞構詞以及姓名構詞。
本文嘗試在語言與資訊兩大學門中做一初步整合。就現有斷詞方法來說,針對中文語音合成單一主題研究是第一次,在學科整合而言,我們期望這只是投石問路!
In this study, we have implemented a word-segmentation system for text-to-speech synthesis in Mandarin Chinese. The proposed word-segmentation system consists of several functional blocks that can be used to decompose a given sentence into natural "word units" for achieving natural prosody in text-to-speech synthesis. We propose two methods for basic word segmentation, including maximum matching algorithm based on longest word first, and dynamic programming based on word length and frequencies.
Moreover, we have applied other schemes to further improve the system's performance, including word construction based on determinative measure, reiterative patterns, and name entities. We also tried to expand the word database via mutual information of on-line news articles. The tone variations that are specific to Mandarin Chinese are also addressed.
1.張孝裕、葉德明,《中國語發音續篇》,台灣復文興業股份有限公司發行,2000年十月初版。ISBN 7-218-00010-8/G.108。
2.張琨,《漢語音韵史論文集》,聯經出版事業公司出版,民國七十六年八月初版。
3.汪壽明、潘文國,《漢語音韵學引論》,華東師範大學出版社出版發行,1992年8月初版。ISBN7-5617-0793-2/H.061。
4.孫玉文,《漢語變調構詞研究》,北京大學出版社出版,2000年6月初版。ISBN7-301-04459-3/H.0529。
5.郭錦桴,《漢語聲調語調闡要與探索》,北京語言學院出版社出版,1993年7月初版。ISBN7-5619-026-1/H.190。
6.聶敏熙,《多音字讀音規範手冊》,巴蜀書社出版發行,2001年7月三刷。ISBN7-80523-831-6/H.29。
7.吳宗濟,《現代漢語語音概要》,華語教學出版社出版,1992年初版。ISBN7-80052-137-0/H.131。
8.徐世榮,《現代漢語語音概要》,語文出版社出版,1993年10月初版。ISBN7-80006-679-7/H.152。
9.李東毅,《普通話正音知識》,語文出版社出版,1995年2月初版。ISBN7-80006-897-8/H.188。
10.金有景,《普通話語音常識》,北京出版社出版,1981年9月初版。
11.徐世榮,《普通話語音知識》,文字改革出版社出版,1980年10月初版。
12.張本楠、楊若薇,《普通話連讀因變》,商務印書館有限公司出版,2000年9月二刷。ISBN962-07-1219-6。
13.陳寶如,《普通話語音》,廣東人民出版社出版,1993年5月二刷。ISBN 7-218-00010-8/G.108。
14.謝明峰,<使用大量語料庫的中文語音合成系統實作>,國立清華大學資訊工程學系92學年碩士論文。
15.廖碩鵬,<中文語音辨識中語言模型的強化>,國立臺灣大學資訊工程學研究所91學年碩士論文。
16.朱怡霖,<中文斷詞與專有名詞辨識之研究>,國立臺灣大學資訊工程學研究所90學年碩士論文。
17.唐大任,<中文斷詞器之研究>,國立交通大學電信工程系90學年碩士論文。
18.鐘祥睿,<台語TTS系統之改進>,國立交通大學電信工程系90學年碩士論文。
19.黃居仁、陳克建<中央研究院平衡語料庫的內容與說明(修訂版)>,中央研究院資訊科學研究所中文詞知識庫小組,1998年8月。Technical Report No. 95-02/98-04。
20.Richard Sproat and Chilin Shin 〈A Statistical Method for Finding Word Boundaries in Chinese Text〉,《Computer Processing of Chinese & Oriental Languages》Vol. 4, No. 4, March 1990.
21.《國語辭典》,教育部國語推行委員會編錄,民國八十七年四月版。網路版URL: http://140.111.1.22/mandr/clc/dict/。