2014/05/15 Tang
0 引言
IP電話是一個復雜的系統工程,涉及到的技術也很繁雜,其中尤以下幾種技術的發展最為關鍵,包括分組語音技術、語音編碼和壓縮技術等。
1 分組語音技術
傳統的電話網是以電路交換的方式傳輸語音,它需要的基本帶寬為64kbit/S。而要在基于IP的分組網絡上傳輸語音,就必須對模擬的語音信號進行特殊的處理,使處理后的信號可以適合在面向無連接的分組網絡上傳輸,這項技術稱為分組語音技術。
1.1 分組語音技術簡述分組語音技術是指將語音信號轉換為一定長度的數字化語音包,采用存儲轉發的方法,以包的形式進行交換和傳輸的技術。電話技術通常需要64kb/S以上的帶寬,而分組語音需要的帶寬不到10kb/S。語音代理設備或部件的任務是將語音信息從傳統的電話格式轉換為適用于分組傳輸的格式。然后通過網絡將分組數據發送到目標的語音代理。
1.2 處理流程無論對于實時的應用還是非實時的應用,發送端語音都要經過模擬信號—數字信號—語音包的處理過程,并在接收端對語音包進行相反的處理,從而得到與輸入端相同的語音信號。我們可以把處理流程分為發送端的處理流程和接收端的處理流程兩部分來介紹。
1.2.1 發送端的處理流程首先,把模擬信號轉換為數字信號,并對其進行進入緩沖器前的量化數據處理。聲卡和音頻設備先對模擬語音信號進行8位或16位量化,然后再送入緩沖器。其次,把語音包按照特定的幀長進行編碼。大部分的編碼器都有特定的幀尺寸,若一個編碼器使用15ms的幀,則把從第一級來的120ms的包分成8幀,并按順序進行編碼。每個幀合2O個語音樣點(抽樣頻率為8kHz)。編碼后,將8個壓縮的幀合成一個壓縮的語音包送入網絡處理器。網絡處理器為語音包添加包頭、時標和其他信息后通過網絡傳送到另一端點。
1.2.2 接收端的處理流程首先,網絡提供一個可變長度的緩沖器,用來調節網絡產生的抖動。緩;中器可容納許多語音包,用戶可選擇緩;中器的大小,大的緩沖器能調節大的抖動,但產生延遲較大,小的緩沖器產生延遲較小,但不能調節大的抖動。其次,解碼器將經過編碼的語音包解壓縮后產生新的語音包。這里也可按幀進行操作,完全和編碼器的長度相同。若幀長度為15ms,則120ms的語音包被分成8幀,然后被解碼還原成20ms的語音數據流送入解碼緩沖器。最后,緩沖器中語音樣點被播放驅動器取出送入聲卡,通過揚聲器按預定的頻率(例如8kHz)播出。
1.3 分組語音的傳輸方案和傳輸系統中的幾個關鍵技術分組語音傳輸網絡可以基于IP、幀中繼或異步傳輸模式(ATM),這些構成了傳統的分組語音傳輸方案,我們分別稱為ATM語音(VoATM)、幀中繼語音(VFFP)、IP語音(VOIP)。VOATM(Voice over ATM)是指在ATM網絡上傳遞分組語音的技術。ATM是利用固定長度(53個字節)信元中的48個字節來存放數據信息的,因此,通過ATM傳輸語音流,要遵循ATM信元的結構規定。VOFR(Voice over Frame Relay)是利用幀中繼網絡傳輸分組語音的技術。幀中繼論壇FRF.11已經建立了用于幀中繼上的語音傳輸以及有關通話建立、編碼類型和分組格式的標準,未來還將提供用于產品互操作性等方面的基本功能。VOIP(Voice over IP)是利用IP網絡進行語音通信的技術。IP是無連接的,在優先級、資源預留、分組拆分等領域的優勢比較引人注目。IP擁有強大的信令、尋址和路由功能。IP的另一優勢在于它與當前眾多的數據應用程序的集成,使得IP網絡應用無所不在。另外,在分組語音網絡傳輸系統中需要解決以下幾個技術才能使分組語音服務滿足質量上的需要。
1.3.1 語音編碼即如何將語音信息轉換為分組信息以及如何將分組信息重新轉換為語音。其中包括優化編碼方案、尋找最佳算法、對語音進行高效、優質的編解碼以及語音恢復等等,這些都已形成了一個學科分支,并受到人們應有的重視。
1.3.2 信令用于鑒別呼叫方所需要呼叫的對象以及呼叫方在網絡中的位置。在許多情況下,如何實現語音編碼、如何保證語音質量并不是分組語音技術的難點,關鍵是可行的分組語音應用要求某地的呼叫者連接至使用其標準撥號機制的語音代理,并將呼叫發送至可以訪問其他語音代理的用戶組。
1.3.3 語音壓縮算法語音壓縮是分組語音系統中的重要組成部分。目前,通過調制解調器接入網絡的最大速率為56kbit/S,遠遠不能適應多媒體通信的要求,而且因特網不能對傳輸帶寬提供保證,因此必須采用低速率的語音壓縮算法來處理語音,這對實時語音應用尤為重要。
1.3.4 音頻回聲消除技術在IP電話的應用中,人們若使用揚聲器和麥克風就可能出現回聲現象。本地揚聲器輸出的模擬語音信號可能又被話筒接收,當信號被傳回到源端時,就會產生不必要的回聲。在因特網中,呼叫必須經過多個路由器和網關,其相當長的延遲又會造成回聲問題的進一步惡化,在系統中使用回聲消除技術可以解決這個問題。目前,回聲消除技術主要有回聲抑制和回聲抵消兩種。
1.3.5 網絡呼叫技求IP電話采用分布式的呼叫模式。因為不需要通過電路交換完成呼叫,所以每個終端都使用了呼叫處理器。單工呼叫模式僅支持一個終端的呼叫,且需要本地呼叫驅動的支持。通過觸發本地呼叫驅動軟件建立一次呼叫,而呼叫驅動利用傳輸控制協議(TCP)的套接字(Socket)與另一端的呼叫驅動建立信令連接,從而觸發另一端的單工呼叫。
2 語音的編碼及壓縮技術
模擬語音信號必須經過處理,轉換成適合在IP網絡上傳輸的 IP數據包。這個過程需要先進行數字編碼,轉換為PCM碼,然后經過專門的DSP芯片進行數據壓縮,最后再打上IP包的標記,形成IP數據包的形式,以適合IP網絡上的傳輸帶寬,其中涉及到了PCM、DSP、編碼、壓縮等內容。
2.1 PCM技術介紹脈沖編碼調制(Pulse Code Modulation簡寫為PCM),是指把模擬信號轉化為數字信號的過程,為目前世界各國主要采用的方式。PCM包括抽樣、量化和編碼三個過程。
2.2 DSP介紹簡述DSP是數字信號處理器(Digital Signal Processor)的縮寫,屬于MPU(微處理器)的一種,它主要應用于聲音壓縮、圖像壓縮等數字壓縮技術領域,能將聲音、圖像、溫度壓力等種種模擬信號高速轉變成數字信號。
2.3 IP語音編碼與壓縮技術通過Internet傳輸實時的語音或圖像與傳輸普通數據是不一樣的,應用網絡的組成必須符合這種實時傳輸的需要。這種傳輸與傳統的數據傳輸有著很大的區別。對于越來越多的語音服務商們來說,能支持高品質的VoIP(Voice over IP)應用是走向成功的一個關鍵因素。話音的分組傳送通常要求網絡提供充足的帶寬,所以對現有的多數IP網絡而言,話音壓縮技術是實施IP話音通信的關鍵所在。編碼壓縮方法由ITU統一制定,并標準化。它的壓縮能力由DSP的處理能力決定,通常DSP的處理能力用MIPS(Millions of intructions per second)來度量。編碼壓縮僅負責對實際傳輸的lP分組數據進行壓縮,它不負責對IP頭壓縮,一般,IP/UDP頭(包括地址信息和控制信息)要耗去7kb/S左右的帶寬,如果有些IP路由器支持IP包頭的壓縮,那么帶寬損耗可以降低到2~3kb/S左右。
40088 411661033743080@qq.com
中國廣東省深圳市南山區西麗九祥嶺工業區10棟3樓