一、數(shù)字編解碼技術(shù)發(fā)展歷程
(一)視頻壓縮標準的制定與發(fā)展
目前,數(shù)字視頻的應(yīng)用涵蓋了各個領(lǐng)域。由于視頻壓縮標準為針對不同應(yīng)用設(shè)計的系統(tǒng)之間提供了一種交互的手段,因此視頻壓縮標準也是數(shù)字視頻應(yīng)用發(fā)展的助推器。制定視頻壓縮標準的組織主要有兩個:ITU-T和ISO/IEC。ITU-T推薦委員會制定的大多數(shù)標準都是為實時視頻通信應(yīng)用的,例如H.261、H.262.H.263和H.264;另一方面,ISO/IEC的MPEG標準大多是為視頻存儲、廣播視頻和視頻流應(yīng)用而制定的標準,包括MPEG-1、MPEG-2和MPEG-4等。兩個標準化委員會組織在獨立地致力于不同的標準的制定的同時,聯(lián)合發(fā)展了H.262/MPEG—2和H.264/AVC。
H.261是ITU-T制定的一個視頻編碼標準,屬于視頻編解碼器部分。H.261是*個實用的數(shù)字視頻編碼標準。其設(shè)計的目的是能夠在帶寬為64kbps倍數(shù)的綜合業(yè)務(wù)數(shù)字網(wǎng)上傳輸質(zhì)量可接受的視頻信號。H.261使用了混合編碼框架。H.261僅對與兼容性有關(guān)的碼濟語法、碼濟復(fù)用、解碼過程等作了嚴格的限制性規(guī)定,而對復(fù)原圖像質(zhì)量指標有重要影響但不影響兼容性的部分不作限制性規(guī)定,給、廠商和用戶提供了很大的活動空間。
H.263是電聯(lián)ITU-T的一個標準草案,是為低碼流通信而設(shè)計的,它提供了四種可選的編碼算法:無限制的運動矢量模式、*預(yù)測模式、PB幀模式和基于語意的算術(shù)預(yù)測模式。
H.263+是H.263的第二個版本。H.263+提供了12個新的可協(xié)商模式和其他特征,如幀內(nèi)編碼、去塊效應(yīng)濾波、參考幀選擇、SNR/時域/空域可分級性等,進一步提高了壓縮編碼性能。H.263+允許使用更多的源格式,圖像時鐘頻率也有多種選擇,拓寬應(yīng)用范圍;另一重要的改進是可擴展性,它允許多速率及多分辨率,增強了視頻信息在易誤碼、易丟包異構(gòu)網(wǎng)絡(luò)環(huán)境下的傳輸,它還允許在碼流內(nèi)加入許多附加的信息,大大方便了用戶的操作。
H.263++是H.263的第三版本,H.263++在視頻流的抗誤碼方面做了不少增強工作,提出了可逆VLC編碼和基于數(shù)據(jù)分類的抗誤碼組合,同時擴展了參考幀選擇模式;增強了抗誤碼系統(tǒng)的魯棒性。
H.26L設(shè)計目的是對多種圖像信源實現(xiàn)低比特率、實時和低延遲的視頻編碼。H.26L是H.264的雛形。H.264同時也是MPEG-4第十部分。H.264作為新一代視頻壓縮算法,H.264吸收了以往各種編碼方案、特別是MPEG-2和H263++的優(yōu)點,并在語法結(jié)構(gòu)、編碼預(yù)測算法、數(shù)據(jù)變換輸出方式等方面進行了很多改進,性能得到了很大的提高。編解碼流程主要包括5個部分:幀間和幀內(nèi)預(yù)測、變換和反交換、量化和反量化、環(huán)路濾波、熵編碼。H.264具有以下特點:低碼流、高質(zhì)量的圖像、容錯能力強、網(wǎng)絡(luò)適應(yīng)性強。
MPEG—1是MPEG組織制定的*個視頻和音頻有損壓縮標準。主要面向碼率為15Mbps的視頻信號的壓縮編碼,音頻主要面向每通道64Kb/s、128Kb/s以及192Kb/s的數(shù)字音頻信號的壓縮。MPEG-1是為CD光碟介質(zhì)定制的視頻和音頻壓縮格式。MPEG-1采用了塊方式的運動補償、離散余弦變換(DCT)、量化等技術(shù),并為12MbPS傳輸速率進行了優(yōu)化。MPEG-1隨后被VideoCD采用作為核心技術(shù)。另外,MPEG-1中設(shè)置了系統(tǒng)層和傳送層。
MPEG—2制定于1994年,提供工業(yè)標準的圖像以及更高的傳輸率是其設(shè)計目標,它是為HDTV和DVD等制定的3MbpS-10MbpS的運動圖像及其伴音的編碼標準。MPEG-2語法的主要特點包括:同時支持隔行掃描輸入和逐行掃描輸入;提供一個較廣的范圍改變壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲容量以及帶寬的要求。MPEG-2根據(jù)視頻編碼技術(shù)的復(fù)雜度,將各類應(yīng)用劃分為不同的檔次(Profile)和級別(level),檔次和級別的概念解決了比特流的可交換性和性。MPEG-2增加了可分級編碼特性,允許從一個編碼數(shù)據(jù)流中得到不同質(zhì)量等級或不同時空分辨率的視頻信號。
MPEG—4于2000年初正式成為標準。MPEG—4的設(shè)計目標就是提供低比特率下的多媒體通信。MPEG—4與之前的標準相比更適于交互AVS服務(wù)以及遠程監(jiān)控,更加注重多媒體系統(tǒng)的交互性和靈活性。MPEG-4的壓縮方法可以根據(jù)應(yīng)用需求選取合適的算法進行系統(tǒng)裁剪。
MPEG-7設(shè)計的目的就是解決海量的圖像與聲音信息、快速檢索之間的矛盾。MPEG一7被稱為多媒體內(nèi)容描述接口。其目標就是產(chǎn)生一種描述多媒體內(nèi)容數(shù)據(jù)的標準,滿足實時、非實時以及推拉應(yīng)用的需求。MPEG-7擴展現(xiàn)有標識內(nèi)容的方案及有限的能力,包含更多的多媒體數(shù)據(jù)類型。MPEG-21設(shè)計的目標是將不同的協(xié)議、標準和技術(shù)等有機地融合在一起,同時制定新的標準,將這些不間的標準集成在一起。MPEG-21致力于為多媒體傳輸和使用定義一個標準化的、可互操作的和高度自動化的開放框架。MPEG-21的基本框架要素包括數(shù)字項目的識別和描述、內(nèi)容表示、數(shù)字項目說明、內(nèi)容管理與使用、知識產(chǎn)權(quán)管理和保護、終端、網(wǎng)絡(luò)和事件報告等部分。
VC-1是微軟開發(fā)的視頻編解碼系統(tǒng)。VC-1是基于WindowsMediaVideo9壓縮技術(shù)的影像壓縮標準。壓縮技術(shù)整合了MPEG及H.264之優(yōu)點,運動搜索的精度可達四分之一像素。VC-1只有4種運動補償(MotionComposition),壓縮比無法勝過H.264。VC-1在壓縮時間上,明顯比H.264短了許多,復(fù)雜度約只有H.264的50%,對電影有很杰出的效能表現(xiàn)。
(二)我國視頻壓縮標準的制定與發(fā)展
AVS由數(shù)字音視頻編解碼技術(shù)標準工作組制定,是我國具備自主知識產(chǎn)權(quán)的第二代信源編碼標準。編碼效率比MPEG-2高2-3倍,與H.264相當,而且技術(shù)方案簡潔,硬件實現(xiàn)復(fù)雜度低,達到了第二代標準的zui高水平。AVS的主要創(chuàng)新在于提出了一批具體的優(yōu)化技術(shù),在較低的復(fù)雜度下實現(xiàn)了與標準相當?shù)募夹g(shù)性能,有效地避開了用標準背后的大量復(fù)雜。AVS是為了適應(yīng)數(shù)字電視廣播、數(shù)字存儲媒體、網(wǎng)絡(luò)流媒體、多媒體通信等應(yīng)用中對運動圖像壓縮技術(shù)的需要而制定的。其適用的主要范圍包括:數(shù)字地面電視廣播(Digitalterrestrialevisionbroadcasting,DTTB)、有線電視(CableTV,CATV)、交互存儲媒體、直播衛(wèi)星視頻業(yè)務(wù)(Directbroadcastsalitevideoservices,DBS)、寬帶視頻業(yè)務(wù)、多媒體郵件、分組網(wǎng)絡(luò)的多媒體業(yè)務(wù)(Multimediaservicesonpacketnetworks,MSPN)、實時通信業(yè)務(wù)(視頻會議,等)等。AVS采用混合編碼框架,包括變換、量化、嫡編碼、幀內(nèi)預(yù)測、幀間預(yù)測、環(huán)路濾波等技術(shù)模塊,這是當前主流的技術(shù)路線。
《安全防范監(jiān)控數(shù)字視音頻編解碼技術(shù)標準》(簡稱SVAC,SurveillanceVideoandAudioCing)。SVAC標準是*個旨在解決安全防范監(jiān)控行業(yè)*要求的技術(shù)標準,對確立中國*和*預(yù)防體系來說比較重要。SVAC標準已在2011年5月1日正式實施,適用于參與安全防范監(jiān)控行業(yè)的所有提供商。
目前H.264編碼標準基于其的編碼效率、強大的網(wǎng)絡(luò)適應(yīng)能力占據(jù)大部分市場,而以MPEG-2為代表的目前仍占據(jù)部分市場的數(shù)字視頻編解碼技術(shù)由于技術(shù)陳舊需要更新和收費等問題慢慢退出歷史舞臺。在我國,由于IPTV市場沒有很好開拓,MPEG-2依然是市場主體,H.264正在逐漸擴大使用范圍,AVS編碼標準分擔了部分H.264市場,SVAC雖已正式發(fā)布,但其作為*旨在解決安全防范監(jiān)控行業(yè)*要求的技術(shù)標準,在安防行業(yè)的應(yīng)用前景還不明朗。
二、數(shù)字編解碼技術(shù)說明
二十年來數(shù)字編解碼標準采用的基本方法幾乎都是基于塊的混合編碼框架,混合編碼框架其技術(shù)方式主要包括基于DCT變換編碼、運動補償?shù)念A(yù)測編碼和熵編碼這是現(xiàn)代視頻編碼的關(guān)鍵技術(shù)。所謂“基于塊”,指的是首先將一幅圖像分成矩形的像素塊,作為編碼處理的基本單元。“混合”指的是消除時間冗余的運動估計與消除空間冗余的變換編碼的結(jié)合。在理想情況下為了充分利用像素之間的空間相關(guān)性,變換應(yīng)該應(yīng)用于整幅圖像或視頻幀;另一方面,如果以單個像素為單位進行運動估計,就能夠地消除時間冗余。但是以上兩種方式的計算復(fù)雜度都相當高,且要求兩者是互相矛盾的。因此,通常采用適當大小的矩形像素塊作為變換編碼和運動估計的基本單位,平衡了編碼效率和計算復(fù)雜度兩方面的矛盾。
數(shù)字視頻編碼是減少數(shù)據(jù)冗余的過程。雖然表示數(shù)字視頻的數(shù)據(jù)量很大,但數(shù)據(jù)之間往往保持高度的相關(guān)性,這些相關(guān)性表現(xiàn)出數(shù)據(jù)的冗余。視頻壓縮編碼就是采用一定的方式減少數(shù)據(jù)之間的相關(guān)性,盡可能消除冗余,使數(shù)據(jù)zui有效的表示信息。通常的數(shù)據(jù)冗余存在與三個方面,時間、空間和心理視覺冗余。
空間冗余產(chǎn)生的原因在于視頻序列都是由一幀一幀的圖像序列組成,對于每幀圖像,前景物體和背景都有很大的相關(guān)性。據(jù)統(tǒng)計,圖像內(nèi)的每個像素都與其距離小于16個像素點的像素相關(guān)。
時間冗余存在的原因在于視頻序列在時間上的相關(guān)性,視頻幀在時間上呈現(xiàn)的是一種近似連續(xù)的變化;在動態(tài)視頻序列中,前一幀圖像和后一幀圖像有很大的相關(guān)性,形成時間上的數(shù)據(jù)冗余。在一定的時間間隔內(nèi),視頻序列中往往背景都相同,前景物體只做微小的變化,或平移、或旋轉(zhuǎn)、或拉伸等等,所以相鄰的兩幀或幾幀上間有許多相同或相近的地方,沒有必要在每幀中都把這些數(shù)據(jù)信息表示出來。
心理視覺冗余是由于人類視覺系統(tǒng)對圖像的變化感知產(chǎn)生的,人的視覺系統(tǒng)是非均勻和非線性的,并不是圖像的所有變化都能感知,同時,人眼對圖像的亮度和色度的敏感度相差很大,對亮度的敏感度遠大于色度的敏感度。心理視覺冗余就是利用人的錯覺來壓縮數(shù)據(jù)量。數(shù)字視頻編碼通過變換編碼和預(yù)測編碼達到消除冗余的目的,通過較小的帶寬傳輸盡量多的有效數(shù)據(jù)。
三、數(shù)字編解碼技術(shù)發(fā)展前景
隨著計算機網(wǎng)絡(luò)的不斷發(fā)展和應(yīng)用需求的多樣化,對于視頻編碼技術(shù)的研究不再僅僅局限于壓縮特性,而漸漸開始向網(wǎng)絡(luò)適應(yīng)性、用戶交互性等方面轉(zhuǎn)移。因此,這幾年來,視頻編碼技術(shù)一方面繼續(xù)以混合編碼為框架研究如何進一步提高壓縮特性,另一方面不斷的向可伸縮編碼、多視點編碼、智能等分支方向發(fā)展。
可伸縮編碼技術(shù)將視頻編解碼框架轉(zhuǎn)變?yōu)楦嗫紤]網(wǎng)絡(luò)適應(yīng)性和靈活性的編解碼框架。2005年2月,JVT將可伸縮性編碼(Sca1ableVideoCoding,SVC)作為H.264標準的擴展,并起草了H.264標準的可伸縮性擴展*草案。可伸縮視頻編碼因為具有時域、空域和質(zhì)量等多方面的靈活性,不僅特別適合網(wǎng)絡(luò)傳輸,而且應(yīng)用到視頻監(jiān)控領(lǐng)域中還能滿足監(jiān)控視頻資料的存儲、檢索、分析等方面的特殊需求。在安防行業(yè),很多情況下,監(jiān)控需要兩份碼流,一份為了本地存儲,需要高分辨率高質(zhì)量的視頻,另一份是為了網(wǎng)絡(luò)傳輸?shù)奖O(jiān)控中心實時查看,需要低分辨率中等質(zhì)量的視頻,常用的解決方案是編碼兩次。如果需要更多不同的碼流就需要編碼更多次,這樣將大大增加計算量,現(xiàn)有的硬件條件很難滿足。因此可伸縮視頻編解碼技術(shù)不僅是JVT組織中的當前熱點研究問題,更是視頻監(jiān)控技術(shù)中的研究熱點問題。到目前為止,實現(xiàn)可伸縮技術(shù)的方法大致上可以劃分為兩種:基于小波變換的可伸縮技術(shù)和基于傳統(tǒng)的混合編碼結(jié)構(gòu)的可伸縮技術(shù)。基于小波的視頻編碼是指以離散小波變換(DWT)為核心的視頻編碼方案,分為以下四大類:純?nèi)S小波方案、小波框架的運動補償方案、小被子帶預(yù)測方案、幀間小波濾波方案。基于混合編碼結(jié)構(gòu)的可伸縮技術(shù)包括:時間可伸縮、空間可伸縮和質(zhì)量/信噪比可伸縮性。
多視點編碼技術(shù)。多視點視頻是一種新型的具有立體感知和交互操作功能的視頻技術(shù),它由一組平行、會聚相機陣列拍攝得到視頻信號。2001年,MPEG成立了3DAV工作組,其首要任務(wù)就是定義3D音視頻領(lǐng)域的范圍和應(yīng)用場景,并為其中的關(guān)鍵技術(shù)制定標準。在視頻監(jiān)控類的應(yīng)用中,多視點視頻編碼技術(shù)有助于實現(xiàn)多視角立體監(jiān)控,多攝像頭聯(lián)動等應(yīng)用。視點間相關(guān)性是多視點視頻序列的重要特性,它與相機陣列形式、相機間距、相機和拍攝對象間距離存在極大的關(guān)系,直接反映在同一時刻相鄰視點兩幅圖像的視差上。由于該類系統(tǒng)存在著大量的數(shù)據(jù)冗余,如何組織和壓縮數(shù)據(jù)就成為重要的研究課題。
安防行業(yè)的智能化已是發(fā)展的必然趨勢,筆者認為如何將視頻監(jiān)控智能化與視頻壓縮編解碼結(jié)合起來,也將是未來視頻編解碼發(fā)展的重要方向。早在MPEG-4的時代,就已經(jīng)提出了基于內(nèi)容的視頻編碼,將場景分割為不同的層次,如背景和前景等,對背景和前景分別利用不同的模型進行編碼,不過由于當時視頻監(jiān)控智能化還未起步,因此這種基于內(nèi)容的視頻編碼發(fā)展緩慢。智能視頻監(jiān)控技術(shù)涉及圖像處理、圖像分析、機器視覺、模式識別、人工智能等眾多研究領(lǐng)域,視頻監(jiān)控的智能化表現(xiàn)為計算機視覺算法在視頻分析中的應(yīng)用。智能視頻監(jiān)控區(qū)別于傳統(tǒng)意義上的監(jiān)控系統(tǒng)在于變被動監(jiān)控為主動監(jiān)控(自動檢測、識別潛在入侵者、可疑目標和突發(fā)事件),即它的智能性。
簡單而言,不僅用攝像機代替人眼;而且用計算機代替人、協(xié)助人,來完成監(jiān)視或控制的任務(wù),從而減輕人的負擔,同時以智能分析為基礎(chǔ)的編碼技術(shù),可以對視頻的內(nèi)容智能進行分類,采用不同的編碼策略,也就是常說的感興趣區(qū)域編碼。基于智能分析的感興趣區(qū)域編碼就是指編碼器根據(jù)智能分析的結(jié)果,對圖片內(nèi)容進行智能分類,然后在壓縮時根據(jù)分類的結(jié)果不同的壓縮質(zhì)量,或在恢復(fù)時某些區(qū)域的解壓縮要求。這是因為子波在空間和頻率域上具有局域性,要*恢復(fù)圖像中的某個局部,并不需要所有編碼都被保留,只要對應(yīng)的一部分編碼*就可以了。在實際應(yīng)用中,我們就可以對一幅圖像中感興趣的部分采用低壓縮比以獲取較好的圖像效果,而對其他部分采用高壓縮比以節(jié)省存儲空間。這樣就能在保證不丟失重要信息的同時又有效地壓縮了數(shù)據(jù)量,實現(xiàn)了真正的交互式智能壓縮。
版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)www.cmr6829.com”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng)www.cmr6829.com)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負責(zé),不承擔此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責(zé)任。
-
免費注冊后,你可以
了解安防行業(yè)更多資訊查看安防行業(yè)供求信息凸顯安防行業(yè)自身價值
馬上注冊會員
-
想快速被買家找到嗎
只需要發(fā)布一條商機,被買家找到的機會高達90%!還等什么?
馬上發(fā)布信息