2014/05/09 Tang
還記得第一次收聽調頻收音機嗎?還記得在多年收聽磁帶之后第一次收聽CD嗎?高清話質電話為我們帶來的就是這樣的感受。隨著VoIP的不斷商用化,系統開發商和服務供應商的重點也由提供VoIP服務轉向提供更高質量的VoIP服務。借助高清電視的強大營銷攻勢,目前HD—sound已經成為被廣泛接受的寬帶語音品牌。這使服務供應商能夠通過自己的IP電話家用網關提供清晰的音質。傳統的“窄帶”電話在語音清晰度和數據傳輸速率方面實現了折中,聲音帶寬為3OOHz~3.4kHz。相比之下,HD—sound采用了寬帶技術,傳輸帶寬為50Hz~7.0kHz或者更高。這不僅大大提高了通話的清晰度和自然度,而且還大大提高了MP3和網絡收音機等其他多種音頻應用的語音清晰度和自然度。本文試圖闡述電話實現高清話質所面臨的障礙,并說明其市場潛力。
高清語音:寬帶電話
“寬帶”電話的傳輸帶寬范圍為l50Hz~6.3kHz。盡管這不是CD帶寬 (20Hz~20kHz),但與窄帶相比,增加的寬帶大大提高了語音的清晰度。大約 20年前,寬帶電話曾針對采用G.722編解碼器的ISDN實現了標準化,但從未真正獲得廣泛部署。不過G.722在新聞領域卻得到了應用,G.722寬帶經常被用于從遙遠的地點傳輸語音,代替語音質量較差的標準電話。由于IP電話已具備針對窄帶語音壓縮算法的強大信號處理功能,因此可輕易通過IP電話的語音引擎來處理寬帶編解碼器,若模數轉換器和數模轉換器支持16kHz采樣率,則IP電話上的寬帶電話只需相對較低的額外開銷。其他推動寬帶電話發展的因素還包括全新的DECT標準CAT-iq,該標準還指定G.722為高清語音所需的編解碼器。PC聲卡支持8kHz、16 kHz、32kHz、44.1kHz和48kHz的采樣率,通常具備寬帶編解碼器所需的處理功率?!癝kype”等基于PC的軟電話應用已在市場廣泛部署。多數企業的IP電話(如西門子的0penstage系列)已經支持寬帶。企業寬帶市場就是這種理念的出色證明,原因是更容易控制終端的硬件和軟件。寬帶需要通話雙方都具備能夠處理寬帶的硬件,話機立即轉至可用的最佳編解碼器。
過去,VoIP不得不面臨性能不可靠的問題。早期只有勇敢的先驅敢于通過網絡建立語音連接,而目前寬帶用戶已紛紛快速采用語音服務供應商提供的全新產品。以前,電話在音質和價格方面不得不進行折中。今天,VoIP音質前所未有地大幅度提升,可輕松POTS(簡單老式電話)服務媲美。由于客戶端設備的可用帶寬和處理功率正逐步實現標準化,因此采用更高的帶寬大幅提高音質就顯得非常實際和刻不容緩。這是供應商提供特色服務的解決之道。VoIP不再僅僅是VOIP。HD-Sound使它成為物超所值的暢銷技術。POTS電話通話與HD-Sound通話相比,不僅聲音更細,而且基本保持一個聲調。HD-Sound可提供“更加溫暖”的通話,能捕捉到我們語音當中所有細微差別?,F在將S誤聽為F的經歷早已成為歷史。HD-Sound可將話音質量挺高幾倍。目前將該技術向更廣的用戶推廣還存在許多相關問題。在頻譜分析圖表中,我們很容易看到HD-Sound具備較大的傳輸頻譜范圍。HD-Sound的傳輸頻譜包括比窄帶電話傳輸頻譜更低和更高的音調,是寬帶通話者能夠獲得非常出色的用戶體驗。
圖2對MOS(平均意見得分)值的分析深刻說明了寬帶是如何被主觀感知的。窄帶G。729A的多數MOS值約為3.5,而高清語音的MOS值至少比其高出30%,達到4.5。要想優化寬帶的部署,話機廠商(固話和無繩電話)必須遵守一些重要的規定:電聲組件,尤其是電話聽筒或免提揚聲器必須能夠在各自的裝置內,以較低的失真度和較高的逼真度重新生成寬帶的整個頻率范圍。這將為設備設計者,尤其是無繩話機或手機等小型設備的設計者帶來巨大挑戰。一流的音質需要付出成本,但巨大的市場將會帶來額外助益。建議將免提電話封裝起來,目的是避免室內的回聲和增強低頻效果,例如被完全封閉起來的家用高保真揚聲器。任何VOIP電話(窄帶或寬帶)在實現全雙工性能時,最難解決的是時延問題。人耳對話音后的回神是不敏感的,否則我們無論在任何室內都將聽到很強的回聲。但是話音與回聲之間的時延越長,人耳對回聲的感知就會更加靈敏,這就是我們在教堂能夠始終聽到回聲的原因。標準IP網絡分組時延可能會超過100ms-相當于一個大教堂的時延。因此需要額外采取措施減少回聲。消除話機內的回聲如同消除進入人耳內的回聲一樣。通過估計、計算和減少麥克風信號產生的回聲,達到取消回聲的目的。這是一項非常艱難的工作,因為它必須適用于話機存在的任何環境。
高清語音幫助拓展
市場高清語音為系統廠商和服務供應商進入全新的市場提供了大量機會。
1 交互式語音響應
您能想象利用預先錄制的語音樣本,借助通話服務預訂機票嗎?一定很難想象得到。目前的主要語音激活服務幾乎讓人發瘋,它們甚至無法辨別培訓話語的輕微增量。采用寬帶技術可以更加輕松的捕獲人類語音的細微差別,使語音激活服務成為潛力巨大的可行服務。在不必與任何人講話的情況下,我們不僅可升級寬帶或話機服務,而且可預訂機票、酒店或火車票。語音識別系統也將受益于不斷增加的寬帶,提供更加出色的識別率,尤其是更加出色的識別齒擦音。(齒擦音是我們講話時發出的S音,因此在窄帶通話中常常會把F字母誤聽為S字母)
2 文本-語音轉換(TTS)
系統將標準的語音文本轉化成語音)采用合成語音)。語音合成器的質量是通過合成語音與人類語音的相似度和可理解度評定的。易懂的文本-語音轉換程序可使視障人士或閱讀障礙人士通過電話或PC收聽書寫的作品。
● 自動轉換:實時將語音樣本轉換為文本
● 汽車語音識別:通過語音控制汽車的各種功能(雨刮器、收音機、車窗等但不能通過語音駕駛車輛?。?br />
● 語音生物識別:說話人驗證。工作車間或任何需要某種身份驗證的場所可以采用這些應用。
● 口述。
● 免提計算:實用與殘障人士的PC命令語音識別。
● 家庭自動化:通過語音控制通常需要開關控制的裝置,例如關閉百葉窗和電燈、打開暖氣裝置。
● 醫療轉錄現代醫學的口述記錄使醫生不必花費大量時問為財務結算創建文檔,而是把更多的時間用來滿足患者的需求。通過計算機和互聯網技術,越來越多的現代化文檔創建方法得到了應用。語音識別(VR)是這些劃時代技術的代表之一。語音識別的速度是每分鐘200個字,準確率高達99%,使醫生從傳統的抄寫服務中解放出來。目前的寬帶連接可為家庭終端用戶提供下行寬帶。為此DECT論壇(http://www。dect.ch/)推出了全新無繩電話標準CAT—iq,進一步挖掘寬帶在VoIP終端領域的潛力。預計將推出下列應用:
高清無繩電話-各大廠商正在積極向市場推出支持高清語音的全新產品。正如上文所述,這意味著升級話機,使其采用改進的麥克風和揚聲器,充分發揮寬帶編解碼器的功效。寬帶電話會議一采用改進的硬件可增加多種新功能,如讓第三方參加語音清晰的電話會議,為用戶帶來一種全新的體驗。網絡收音機一作為推出的一種全新服務,未來的CAT~iq產品將支持News—nckers等產品和更加引人注目的高清網絡收音機。這有望成為家用VoIP的殺手級應用,它將互聯網的強大功能與高清音質有機地結合起來?,F在,身在澳大利亞的愛爾蘭人和身在慕尼黑的中國人在地下室不用PC就可分別收聽Radio Cork和上海FM電臺節目。音頻流媒體一CAT—iq將使無繩設備廠商和服務供應商進入原來由高保真專業廠商占據的市場。帶有DECT接收器的音頻揚聲器將成為家庭內部甚至家庭內不同樓層之間音頻內容傳輸的理想解決方案。該應用設備不僅具備穩定的空中接口,而且具備最佳的功耗。
總結
處于該產業鏈上的所有人都會從高清語音的發展中受益;最重要的是終端用戶將獲得一種永遠不想失去的全新體驗。
40088 411661033743080@qq.com
中國廣東省深圳市南山區西麗九祥嶺工業區10棟3樓