簡易檢索 / 詳目顯示

研究生: 劉欣華
Shin-Hua Liu
論文名稱: G.723.1語音編碼器之改進
Improvement of G.723.1 Speech Coder
指導教授: 王小川
Hsiao-Chuan Wang
口試委員:
學位類別: 碩士
Master
系所名稱: 電機資訊學院 - 電機工程學系
Department of Electrical Engineering
論文出版年: 1999
畢業學年度: 87
語文別: 中文
論文頁數: 75
中文關鍵詞: 線頻譜對量化音高
相關次數: 點閱:73下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 隨著數位通信的萌芽,語音壓縮技術已被廣泛應用在通訊及資訊儲存上,藉著數位化的語音處理,使語音達到更有效率的傳送及儲存的目的。在過去的十幾年當中,ITU(International Tele- communication Union),在語音編碼的領域中,依據各種不同的應用需求制定出不同的語音編碼標準。在一般通訊考量下,對於語音編碼方法的優劣可根據下列四個因素來評估:一、合成語音的品質(Quality);二、位元率的大小(Bit rate);三、編碼延遲(Coding delay);四、演算法的複雜度(Complexity)。而在這些語音編碼標準中,1995年制定出的5.3 and 6.3 kbit/s 語音編碼器G.723.1:MPC-MLQ(Multipulse Maximum Likelihood Quantization )是使用位元率最低的編碼器,它有兩種傳輸位元率可供給每個語音音框來選擇,使得系統能在有限的頻寬資源下,根據使用量的大小,有效的調整傳輸位元率,進而增加可使用的通道數。此外,它在合成語音品質上也有不錯的性能表現。在維持前面兩個優點的前提下,本論文研究G.723.1語音編碼器的重點放在兩個地方:(1) 如何降低演算法的複雜度 — 提出不同於原G.723.1 線頻譜對( Line Spectrum Pair )係數的量化時所用的方式,使量化過程變得更簡單,而仍維持原來的合成語音品質。還有,改變原來開迴路音高( Open-loop Pitch )的搜尋方法,更快尋找到次佳的音高週期位置,且估出的值與原來相差不多。 (2) 如何提高抗雜訊能力 — 藉由對系統增加背景雜訊的判斷,決定是否要處理輸入的音框,來避免將背景雜訊套入語音模型,使在合成語音時不會有產生更多雜訊的可能,而且當輸入編碼器的語句的停頓處越多時,整個語音編碼器的處理速度就會越快。


    第一章 緒 論 .............................................1 1.1 前言 .................................................1 1.2 簡介ITU-T G.723.1語音編碼器 ..........................2 1.3 研究動機 ...........................................4 1.4 章節簡介 .............................................5 第二章G.723.1的編碼端 ....................................6 2.1 概述...............................................6 2.2 前置處理器 ........................................7 2.3 線性預估分析及量化 ................................9 2.3.1 線性預估係數的轉換 ...........................10 2.3.2 線頻譜對係數的量化方式 .......................12 2.3.3 線頻譜對係數的解碼 ...........................14 2.4 線頻譜對係數的插補及轉換 ..........................15 2.5 共振聽覺加權濾波器.................................17 2.6 開迴路音高分析 ....................................18 2.7 調和雜訊的形成 ....................................19 2.8 閉迴路音高分析 ....................................21 2.9 非週期激發信號的量化 ..............................22 2.9.1 高速率激發(MP-MLQ) ...........................22 2.9.2 低速率激發(ACELP) ............................24 2.10 音高資訊的解碼 ...................................29 2.11 激發源的解碼 .....................................30 2.12 濾波器的更新 .....................................31 第三章 G.723.1的解碼端 ...................................32 3.1 概述 ..............................................32 3.2 後置濾波器 ........................................33 3.2.1 音高後置濾波器................................33 3.2.2 線性預估合成濾波器 ...........................35 3.2.3 共振後置濾波器 ...............................36 3.3 增益取刻度單元 ....................................36 第四章 線頻譜對係數量化方法的改進 ........................38 4.1 前言 ..............................................38 4.2 原理 ..............................................39 4.3 碼本的訓練 ........................................40 4.4 LSVQ的編碼 ........................................43 4.5 LSVQ的解碼 ........................................45 4.6量化效能的量測 .....................................47 4.7 執行速度的量測 ....................................48 4.8 語音測試資料庫 ....................................48 4.9 線頻譜對係數量化方式之比較 ........................50 4.10 實驗結果說明 .....................................52 第五章 音高搜尋方法的改進 ................................54 5.1 前言 ..............................................54 5.2 改進的開迴路音高搜尋法 ............................54 5.3 語音品質的測試 ....................................56 5.4 音高搜尋方式之比較 ................................58 5.5 實驗結果說明 ......................................61 第六章 背景雜訊的判斷 ....................................62 6.1 前言 ..............................................62 6.2 參數的定義 ........................................63 6.3 臨界值的求取 ......................................64 6.4 判斷的法則 ........................................65 6.5 背景雜訊的判斷實驗 ................................66 6.6 實驗結果說明 ......................................70 第七章結論 ...............................................71

    [PA93] K. K. Paliwal, B. S. Atal,“Efficient Vector Qantiza-
    tion of LPC Parameters at 24 Bits/Frame”,IEEE Trans.
    Speech and Audio Processing, Vol. 1, No. 1, pp. 3-14,
    1993.
    [OA98] M. Oshikiri, M. Akamine, “A 2.4 Kbps Variable Bit Rate
    ADP-CELP Speech Coder”, IEEE ICASSP, pp. 517-520, 1998.
    [BWY96] MyungJin BAE, HweYoong Whang, HahYoung YOO, “On A
    Fast Pitch Searching By Using A Simple Correlation
    Technique in the CELP Vocoder”, IEEE ICASSP, pp. 1256-
    1259, 1996.
    [KHK95] Moo Young Kim, Nam Kyu Ha, Sang Ryong Kim, " Linked
    Split-Vector Quantizer of LPC Parameters”, IEEE
    ICASSP, pp.741-744, 1995.
    [KD94] A. M. Kondoz, Digital Speech Coding for Low Bit Rate
    Communications Systems, Ch. 4, 1994.
    [LBG80] Y. Linde, A. Buzo, R. M. Gray,“An Algorithm for Vector
    Quantizer Design, IEEE Trans. Comm”,Vol. COM-28, pp.
    84-95, Jan. 1980.
    [IC97] IEEE Communication Magazine. September, pp. 38-47, 1997.
    [FI75] F. Itakura, “Line Spectrum Representation of Linear
    Predictive Coefficients”, J. Acoust. Soc.Amer,Vol.
    57,Suppl. No. 1, p.S35,1975.
    [KR86] P. Kabal, R. P. Ramachandran, “The Computation of Line
    Spectral Frequencies Using Chebyshev Polynomials”,IEEE
    Trans. Acoust, Speech, Signal Processing, Vol. Assp-34,
    pp.1419-1426, 1986.
    [SG96] Study Group 15 contribution, ITU-T Recommendation
    G.723.1,Dual Rate Speech Coder for Multimedia Communi-
    cation Transmitting at 5.3 and 6.3 kbit/s, March 1996.
    [AM87] J. Adoual, P. Mabilleau, M. Delprat, S. Morisette,“Fast
    CELP coding based on Algebraic codes”, IEEE ICASSP, pp.
    1957-1960, 1987.
    [AL87] J. Adoual, C. Lamblin, “Comparison of some algebraic
    structures for CELP coding of speech”, IEEE ICASSP, pp.
    1953-1956, 1987.
    [GX87] N. Gouvianakis, C. Xydeas, “Advance in Analysis-by-
    Synthesis LPC speech coders”, IEEE J. on IERE, pp. 272-
    286, December 1987.
    [KD88] P. Kroon, E. Deprettere, "A class of analysis-by-
    synthesis predictive coders for high quality speech
    coding at rates between 3.8 and 16 kbit/s”, IEEE J. on
    Selected Areas in Comm. , pp.353-363, February 1988.

    無法下載圖示 全文公開日期 本全文未授權公開 (校內網路)

    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE