G.723.1語音編碼器之改進｜國立清華大學博碩士論文庫

簡易檢索 / 詳目顯示

回結果列表

研究生：	劉欣華 Shin-Hua Liu
論文名稱：	G.723.1語音編碼器之改進 Improvement of G.723.1 Speech Coder
指導教授：	王小川 Hsiao-Chuan Wang
口試委員:
學位類別：	碩士 Master
系所名稱：	電機資訊學院 - 電機工程學系 Department of Electrical Engineering
論文出版年：	1999
畢業學年度：	87
語文別：	中文
論文頁數：	75
中文關鍵詞：	線頻譜對、量化、音高
相關次數：	點閱：73 下載：0
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

隨著數位通信的萌芽，語音壓縮技術已被廣泛應用在通訊及資訊儲存上，藉著數位化的語音處理，使語音達到更有效率的傳送及儲存的目的。在過去的十幾年當中，ITU(International Tele- communication Union)，在語音編碼的領域中，依據各種不同的應用需求制定出不同的語音編碼標準。在一般通訊考量下，對於語音編碼方法的優劣可根據下列四個因素來評估：一、合成語音的品質(Quality)；二、位元率的大小(Bit rate)；三、編碼延遲(Coding delay)；四、演算法的複雜度(Complexity)。而在這些語音編碼標準中，1995年制定出的5.3 and 6.3 kbit/s 語音編碼器G.723.1：MPC-MLQ(Multipulse Maximum Likelihood Quantization )是使用位元率最低的編碼器，它有兩種傳輸位元率可供給每個語音音框來選擇，使得系統能在有限的頻寬資源下，根據使用量的大小，有效的調整傳輸位元率，進而增加可使用的通道數。此外，它在合成語音品質上也有不錯的性能表現。在維持前面兩個優點的前提下，本論文研究G.723.1語音編碼器的重點放在兩個地方：(1) 如何降低演算法的複雜度 — 提出不同於原G.723.1 線頻譜對( Line Spectrum Pair )係數的量化時所用的方式，使量化過程變得更簡單，而仍維持原來的合成語音品質。還有，改變原來開迴路音高( Open-loop Pitch )的搜尋方法，更快尋找到次佳的音高週期位置，且估出的值與原來相差不多。 (2) 如何提高抗雜訊能力 — 藉由對系統增加背景雜訊的判斷，決定是否要處理輸入的音框，來避免將背景雜訊套入語音模型，使在合成語音時不會有產生更多雜訊的可能，而且當輸入編碼器的語句的停頓處越多時，整個語音編碼器的處理速度就會越快。

第一章 緒 論 .............................................1
1 前言 .................................................1

2 簡介ITU-T G.723.1語音編碼器 ..........................2

3 研究動機 ...........................................4

4 章節簡介 .............................................5

第二章G.723.1的編碼端 ....................................6

1 概述...............................................6

2 前置處理器 ........................................7

3 線性預估分析及量化 ................................9

3.1 線性預估係數的轉換 ...........................10

3.2 線頻譜對係數的量化方式 .......................12

3.3 線頻譜對係數的解碼 ...........................14

4 線頻譜對係數的插補及轉換 ..........................15

5 共振聽覺加權濾波器.................................17

6 開迴路音高分析 ....................................18

7 調和雜訊的形成 ....................................19

8 閉迴路音高分析 ....................................21

9 非週期激發信號的量化 ..............................22

9.1 高速率激發(MP-MLQ) ...........................22

9.2 低速率激發(ACELP) ............................24

10 音高資訊的解碼 ...................................29

11 激發源的解碼 .....................................30

12 濾波器的更新 .....................................31

第三章 G.723.1的解碼端 ...................................32

1 概述 ..............................................32

2 後置濾波器 ........................................33

2.1 音高後置濾波器................................33

2.2 線性預估合成濾波器 ...........................35

2.3 共振後置濾波器 ...............................36

3 增益取刻度單元 ....................................36

第四章 線頻譜對係數量化方法的改進 ........................38

1 前言 ..............................................38

2 原理 ..............................................39

3 碼本的訓練 ........................................40

4 LSVQ的編碼 ........................................43

5 LSVQ的解碼 ........................................45

6量化效能的量測 .....................................47

7 執行速度的量測 ....................................48

8 語音測試資料庫 ....................................48

9 線頻譜對係數量化方式之比較 ........................50

10 實驗結果說明 .....................................52

第五章 音高搜尋方法的改進 ................................54

1 前言 ..............................................54

2 改進的開迴路音高搜尋法 ............................54

3 語音品質的測試 ....................................56

4 音高搜尋方式之比較 ................................58

5 實驗結果說明 ......................................61

第六章 背景雜訊的判斷 ....................................62

1 前言 ..............................................62

2 參數的定義 ........................................63

3 臨界值的求取 ......................................64

4 判斷的法則 ........................................65

5 背景雜訊的判斷實驗 ................................66

6 實驗結果說明 ......................................70

第七章結論 ...............................................71

[PA93] K. K. Paliwal, B. S. Atal,“Efficient Vector Qantiza-
tion of LPC Parameters at 24 Bits/Frame”,IEEE Trans.
Speech and Audio Processing, Vol. 1, No. 1, pp. 3-14,
1993.
[OA98] M. Oshikiri, M. Akamine, “A 2.4 Kbps Variable Bit Rate
ADP-CELP Speech Coder”, IEEE ICASSP, pp. 517-520, 1998.
[BWY96] MyungJin BAE, HweYoong Whang, HahYoung YOO, “On A
Fast Pitch Searching By Using A Simple Correlation
Technique in the CELP Vocoder”, IEEE ICASSP, pp. 1256-
1259, 1996.
[KHK95] Moo Young Kim, Nam Kyu Ha, Sang Ryong Kim, " Linked
Split-Vector Quantizer of LPC Parameters”, IEEE
ICASSP, pp.741-744, 1995.
[KD94] A. M. Kondoz, Digital Speech Coding for Low Bit Rate
Communications Systems, Ch. 4, 1994.
[LBG80] Y. Linde, A. Buzo, R. M. Gray,“An Algorithm for Vector
Quantizer Design, IEEE Trans. Comm”,Vol. COM-28, pp.
84-95, Jan. 1980.
[IC97] IEEE Communication Magazine. September, pp. 38-47, 1997.
[FI75] F. Itakura, “Line Spectrum Representation of Linear
Predictive Coefficients”, J. Acoust. Soc.Amer,Vol.
57,Suppl. No. 1, p.S35,1975.
[KR86] P. Kabal, R. P. Ramachandran, “The Computation of Line
Spectral Frequencies Using Chebyshev Polynomials”,IEEE
Trans. Acoust, Speech, Signal Processing, Vol. Assp-34,
pp.1419-1426, 1986.
[SG96] Study Group 15 contribution, ITU-T Recommendation
G.723.1,Dual Rate Speech Coder for Multimedia Communi-
cation Transmitting at 5.3 and 6.3 kbit/s, March 1996.
[AM87] J. Adoual, P. Mabilleau, M. Delprat, S. Morisette,“Fast
CELP coding based on Algebraic codes”, IEEE ICASSP, pp.
1957-1960, 1987.
[AL87] J. Adoual, C. Lamblin, “Comparison of some algebraic
structures for CELP coding of speech”, IEEE ICASSP, pp.
1953-1956, 1987.
[GX87] N. Gouvianakis, C. Xydeas, “Advance in Analysis-by-
Synthesis LPC speech coders”, IEEE J. on IERE, pp. 272-
286, December 1987.
[KD88] P. Kroon, E. Deprettere, "A class of analysis-by-
synthesis predictive coders for high quality speech
coding at rates between 3.8 and 16 kbit/s”, IEEE J. on
Selected Areas in Comm. , pp.353-363, February 1988.

全文公開日期本全文未授權公開 (校內網路)

全文公開日期本全文未授權公開 (國家圖書館：臺灣博碩士論文系統)

簡易檢索 / 詳目顯示

相關論文