| 研究生: |
劉欣華 Shin-Hua Liu |
|---|---|
| 論文名稱: |
G.723.1語音編碼器之改進 Improvement of G.723.1 Speech Coder |
| 指導教授: |
王小川
Hsiao-Chuan Wang |
| 口試委員: | |
| 學位類別: |
碩士 Master |
| 系所名稱: |
電機資訊學院 - 電機工程學系 Department of Electrical Engineering |
| 論文出版年: | 1999 |
| 畢業學年度: | 87 |
| 語文別: | 中文 |
| 論文頁數: | 75 |
| 中文關鍵詞: | 線頻譜對 、量化 、音高 |
| 相關次數: | 點閱:73 下載:0 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
隨著數位通信的萌芽,語音壓縮技術已被廣泛應用在通訊及資訊儲存上,藉著數位化的語音處理,使語音達到更有效率的傳送及儲存的目的。在過去的十幾年當中,ITU(International Tele- communication Union),在語音編碼的領域中,依據各種不同的應用需求制定出不同的語音編碼標準。在一般通訊考量下,對於語音編碼方法的優劣可根據下列四個因素來評估:一、合成語音的品質(Quality);二、位元率的大小(Bit rate);三、編碼延遲(Coding delay);四、演算法的複雜度(Complexity)。而在這些語音編碼標準中,1995年制定出的5.3 and 6.3 kbit/s 語音編碼器G.723.1:MPC-MLQ(Multipulse Maximum Likelihood Quantization )是使用位元率最低的編碼器,它有兩種傳輸位元率可供給每個語音音框來選擇,使得系統能在有限的頻寬資源下,根據使用量的大小,有效的調整傳輸位元率,進而增加可使用的通道數。此外,它在合成語音品質上也有不錯的性能表現。在維持前面兩個優點的前提下,本論文研究G.723.1語音編碼器的重點放在兩個地方:(1) 如何降低演算法的複雜度 — 提出不同於原G.723.1 線頻譜對( Line Spectrum Pair )係數的量化時所用的方式,使量化過程變得更簡單,而仍維持原來的合成語音品質。還有,改變原來開迴路音高( Open-loop Pitch )的搜尋方法,更快尋找到次佳的音高週期位置,且估出的值與原來相差不多。 (2) 如何提高抗雜訊能力 — 藉由對系統增加背景雜訊的判斷,決定是否要處理輸入的音框,來避免將背景雜訊套入語音模型,使在合成語音時不會有產生更多雜訊的可能,而且當輸入編碼器的語句的停頓處越多時,整個語音編碼器的處理速度就會越快。
[PA93] K. K. Paliwal, B. S. Atal,“Efficient Vector Qantiza-
tion of LPC Parameters at 24 Bits/Frame”,IEEE Trans.
Speech and Audio Processing, Vol. 1, No. 1, pp. 3-14,
1993.
[OA98] M. Oshikiri, M. Akamine, “A 2.4 Kbps Variable Bit Rate
ADP-CELP Speech Coder”, IEEE ICASSP, pp. 517-520, 1998.
[BWY96] MyungJin BAE, HweYoong Whang, HahYoung YOO, “On A
Fast Pitch Searching By Using A Simple Correlation
Technique in the CELP Vocoder”, IEEE ICASSP, pp. 1256-
1259, 1996.
[KHK95] Moo Young Kim, Nam Kyu Ha, Sang Ryong Kim, " Linked
Split-Vector Quantizer of LPC Parameters”, IEEE
ICASSP, pp.741-744, 1995.
[KD94] A. M. Kondoz, Digital Speech Coding for Low Bit Rate
Communications Systems, Ch. 4, 1994.
[LBG80] Y. Linde, A. Buzo, R. M. Gray,“An Algorithm for Vector
Quantizer Design, IEEE Trans. Comm”,Vol. COM-28, pp.
84-95, Jan. 1980.
[IC97] IEEE Communication Magazine. September, pp. 38-47, 1997.
[FI75] F. Itakura, “Line Spectrum Representation of Linear
Predictive Coefficients”, J. Acoust. Soc.Amer,Vol.
57,Suppl. No. 1, p.S35,1975.
[KR86] P. Kabal, R. P. Ramachandran, “The Computation of Line
Spectral Frequencies Using Chebyshev Polynomials”,IEEE
Trans. Acoust, Speech, Signal Processing, Vol. Assp-34,
pp.1419-1426, 1986.
[SG96] Study Group 15 contribution, ITU-T Recommendation
G.723.1,Dual Rate Speech Coder for Multimedia Communi-
cation Transmitting at 5.3 and 6.3 kbit/s, March 1996.
[AM87] J. Adoual, P. Mabilleau, M. Delprat, S. Morisette,“Fast
CELP coding based on Algebraic codes”, IEEE ICASSP, pp.
1957-1960, 1987.
[AL87] J. Adoual, C. Lamblin, “Comparison of some algebraic
structures for CELP coding of speech”, IEEE ICASSP, pp.
1953-1956, 1987.
[GX87] N. Gouvianakis, C. Xydeas, “Advance in Analysis-by-
Synthesis LPC speech coders”, IEEE J. on IERE, pp. 272-
286, December 1987.
[KD88] P. Kroon, E. Deprettere, "A class of analysis-by-
synthesis predictive coders for high quality speech
coding at rates between 3.8 and 16 kbit/s”, IEEE J. on
Selected Areas in Comm. , pp.353-363, February 1988.
全文公開日期 本全文未授權公開 (校內網路)