專利名稱:用于可縮放與非可縮放視頻編解碼器之間的譯碼的系統(tǒng)和方法
用于可縮放與非可縮放視頻編解碼器之間的譯碼的系統(tǒng)和
方法相關(guān)申請的交叉引用本申請要求2006年3月四日提交的美國臨時專利申請S/N. 60/786,997的權(quán)益。此外,本申請涉及并要求國際專利申請No. PCT/US06/^8365、PCT/US06/028366, PCT/ US06/028367、PCT/US06/028368、PCT/US06/061815、PCT/US06/62569、PCT/US07/62357 和 PCT/US07/63335的權(quán)益。所有前述優(yōu)先權(quán)以及共同轉(zhuǎn)讓的相關(guān)申請由此通過引用全部結(jié)合于此。發(fā)明領域本發(fā)明涉及視頻數(shù)據(jù)通信系統(tǒng)。本發(fā)明尤其涉及用于將經(jīng)編碼的數(shù)字視頻從一種可縮放視頻編碼格式轉(zhuǎn)換成另一種、或者在可縮放與其它非可縮放視頻編碼格式之間進行轉(zhuǎn)換的技術(shù)。
背景技術(shù):
數(shù)字視頻通信系統(tǒng)可采用一種——且有時候多種——數(shù)字視頻編碼格式進行視頻的編碼、存儲和輸送。例如,在傳統(tǒng)視頻會議系統(tǒng)中,使用H. 261和H. 263視頻編碼標準兩者,而在數(shù)字電視系統(tǒng)中,利用MPEG-2/H. 262視頻編碼。更新近的系統(tǒng)在視頻會議和廣播設置兩者中使用H. 264視頻。對在視頻通信系統(tǒng)中使用不同編碼格式的這種需求是在不同應用域內(nèi)存在不同操作方案的直接結(jié)果。注意即使相同的編碼格式被用在兩個不同應用域中——如同在視頻會議、移動、和廣播電視應用中使用H. 264的情形中——在這兩個不同應用域中所用的格式的具體方式可以是不同的。結(jié)果,在一個應用域中創(chuàng)建的內(nèi)容可能不能被另一個域的系統(tǒng)直接解碼。要求信號更改。甚至在的確使用相同編碼格式的實例中,常常有經(jīng)編碼的視頻信號的比特率高于特定應用環(huán)境中能使用的比特率并因此需要被縮減的的情形。當可在整體系統(tǒng)中獲得率失真改進時,也可采用譯碼。在實際應用中,對內(nèi)容互操作性的需求造成若干情況期望有效地在不同視頻編碼格式之間以及在相同格式的不同參數(shù)設置(諸如比特率)之間轉(zhuǎn)換。這些技術(shù)統(tǒng)稱為 ‘譯碼’技術(shù)。對比特流格式轉(zhuǎn)換的一個示例是在使用新編解碼器的應用中支持傳承編解碼器。 例如,當參與者使用不能被另一參與者解碼的比特流格式連接到視頻會議時,譯碼可被用于格式轉(zhuǎn)換。可能期望給定編碼格式內(nèi)的譯碼來執(zhí)行空間分辨率中的變化,以便適應接收器的可用顯式尺寸、比特率、處理功率或功耗,或通用編碼效率考慮。類似地,可能還期望改變時間分辨率以適應接收器的可用比特率、處理功率和功耗,或出于通用編碼效率考慮。另一種轉(zhuǎn)換通常期望改變比特流大小、或比特率以適應接收器在比特率、處理功率或功耗方面的能力。對譯碼的需求的另一個示例是用于更改比特流特性,例如,用于差錯彈性或編碼效率。比特流的更改可包括譬如內(nèi)宏塊的編碼決策的變化。
譯碼可能還涉及一個或多個前述變化的組合。已開發(fā)了用于標準視頻編解碼器的譯碼技術(shù)來滿足例如MPEG-2與H. 264之間的特定應用環(huán)境,以允許廣播電視視頻到適于IP電視和移動電視應用的格式的轉(zhuǎn)換。這些譯碼技術(shù)針對使用現(xiàn)行單層編碼技術(shù)編碼的視頻。除傳統(tǒng)的單層編解碼器之外,分層或可縮放編碼可用于視頻編碼??煽s放編碼用于生成以比特率效率方式共同代表給定視頻信號的兩個或多個“經(jīng)縮放”比特流??煽s放性可以多個不同維度——即時間、空間和質(zhì)量(也稱為SNR “信噪比”可縮放性或保真度可縮放性)——來提供。取決于編解碼器的結(jié)構(gòu),空間分辨率和幀率的任何組合可從編解碼器比特流獲得。例如,視頻信號可以CIF或QCIF分辨率且每秒7.5、15和30幀(fps)的幀率下的不同層來可縮放地編碼。與不同層相對應的比特可作為單獨的比特流傳送(即,每層一個流)或它們可在一個或多個比特流中被復用在一起。為了便于本文的描述,與給定層相對應的經(jīng)編碼比特可稱為該層的比特流,即使各個層被復用且在單個比特流中傳送。專門設計成提供可縮放性特征的編解碼器包括例如MPEG-2 (也稱為ITU-T H. 262 的 IS0/IEC13818-2)和目前開發(fā)的 SVC(稱為 ITU-T H. 264AnnexG 或 MPEG-4 第 10 部分
SVC)。在共同轉(zhuǎn)讓的國際專利申請 No. PCT/US06/(^8365- "SYSTEM AND METHOD FOR
SCALABLE ANDLOff-DELAY VIDEOCONFERENCING USING SCALABLE VIDEO CODING (用于使用可縮放視頻編碼的可縮放和低延遲視頻會議的系統(tǒng)和方法)”——中描述了為視頻通信專門設計的可縮放編碼技術(shù)。注意,即使并非專門設計成可縮放的編解碼器也可以在時間維度呈現(xiàn)可縮放性的特性。例如,考慮MPEG-2Main ft^file (主型)編解碼器——DVD和數(shù)字TV環(huán)境中使用的非可縮放編解碼器。此外,假定以30fps操作的編解碼器以及使用 IBBPBBPBBPBBPBB (周期N = 15幀)的畫面組(GOP)結(jié)構(gòu)。通過連續(xù)消去B畫面,接著消去P畫面,得到總共三個時間分辨率——30fps (包括所有畫面類型)、10fps (僅有I和P) 以及2fps (僅有I)——是可能的。連續(xù)消去過程導致可解碼的比特流,因為MPEG-2Main Profile編解碼器被設計成使得P畫面的編碼不依賴于B畫面,并且類似的I畫面的編碼不依賴于其它P或B畫面。在以下,具有時間可縮放性特征的單層編解碼器被認為是可縮放視頻編碼的特例,因此被包括在術(shù)語可縮放視頻編碼中,除非另外明確指明。可縮放編解碼器通常具有錐形比特流結(jié)構(gòu),其中組成比特流之一(稱為“基層”) 在恢復某種基本質(zhì)量的原始媒體時是必需的。連同基層一起使用剩余比特流(稱為“增強層”)的一個或多個提升了所恢復的媒體的質(zhì)量。對于諸如多點視頻會議的交互式視頻通信應用,可縮放視頻編碼是特別有效的編碼技術(shù)。共同轉(zhuǎn)讓的國際專利申請No. PCT/US06/28366和No. PCT/US06/62569分別描述了與傳統(tǒng)多點控制單元(MCU)用于相同用途的‘、calable Video Communication Server (可縮放視頻通信服務器)” (SVCS)和"Compositing Scalable Video Communication ServeH合成可縮放視頻通信服務器)”(CSVCQ架構(gòu),但是具有顯著縮減的復雜度和改進的功能。類似地,共同轉(zhuǎn)讓的國際專利申請No. PCT/US06/061815和PCT/US07/63335描述了用于改進此類系統(tǒng)中的差錯彈性、隨機接入和率控制的機制??煽s放視頻中的譯碼共享單層譯碼的若干特性,但是具有對于可縮放視頻應用或需求而言唯一的附加特性。視頻會議設置中需要可縮放編碼格式之間的譯碼的環(huán)境可包括
-多方視頻會議中的參與者要求一視頻信號特性,該視頻信號特性在與其它會議參與者要求的比特流的視頻信號特性聯(lián)用的特定可縮放視頻編碼格式中不能被有效地表示。一個示例是結(jié)合對與其它要求的視頻分辨率略微不同的視頻分辨率的要求使用CSVCS。 需要譯碼來提供略微不同的視頻分辨率。-參與者具有傾向于比其他參與者的傳輸信道有更多差錯的傳輸信道。需要譯碼來插入多個切片和內(nèi)宏塊以補償所增加的差錯。-譯碼成相關(guān)單層格式以支持傳承端點(例如,從H.264SVC到AVC)。-譯碼成非相關(guān)單層格式以支持傳承端點(例如,從H.264SVC到H. 263, MPEG2、 H. 26UMPEG-4的任一種,或除H. 264和SVC之外的任何其他視頻比特流格式)。參照以上所提及的后兩種情況,注意與可縮放視頻編碼格式相比,相關(guān)和非相關(guān)單層編碼格式之間的差別是顯著的。例如,SVC是H. ^HAVC的擴展,因此共享許多公共要素,諸如高層語法、運動補償、變換編碼和去塊濾波器。因此,這兩種格式之間的變換更易于以計算效率方式來執(zhí)行?,F(xiàn)在考慮使用可縮放視頻編碼的視頻通信系統(tǒng)中的譯碼。關(guān)注用于可縮放與非可縮放比特流之間——在雙向上——的譯碼的技術(shù)。合需的譯碼技術(shù)對視頻信號的質(zhì)量將具有最小的影響,且具有較高的計算效率。發(fā)明概要提供了用于在使用可縮放視頻編碼的視頻通信系統(tǒng)中執(zhí)行譯碼的系統(tǒng)和方法。此系統(tǒng)和方法被用于將具有特定特性的輸入信號譯碼或轉(zhuǎn)換成具有不同特性要求的期望輸出信號。文本描述了六種不同示例性譯碼轉(zhuǎn)換類別。在三種示例性類別中,期望輸出具有特定時間、質(zhì)量或空間分辨率要求。在另外三種示例性類別中,期望輸出具有質(zhì)量和時間、 空間和時間的組合、或結(jié)合空間、質(zhì)量和時間的分辨率要求。在每種類別內(nèi),提供了用于從 H. 264SVC到AVC、從AVC到SVC、以及從SVC到SVC的轉(zhuǎn)換的特定系統(tǒng)和方法。取決于輸入和期望輸出信號的具體特性,這些系統(tǒng)和方法是基于壓縮域處理、空間解碼重編碼、或使用輔助信息的全解碼-重編碼的。
根據(jù)以下優(yōu)選實施例的詳細描述以及附圖,本發(fā)明的其它特征、性質(zhì)和各個優(yōu)點將變得更顯而易見,在附圖中圖1是示出根據(jù)本發(fā)明的原理的譯碼系統(tǒng)的整體架構(gòu)的框圖;圖2是示出根據(jù)本發(fā)明的原理的使用全解碼和重編碼的示例性譯碼系統(tǒng)的框圖;圖3是示出根據(jù)本發(fā)明的原理的使用部分解碼和重編碼的示例性譯碼系統(tǒng)的框圖;圖4是示出根據(jù)本發(fā)明的原理的使用壓縮域操作的示例性譯碼系統(tǒng)的示圖;圖5是示出根據(jù)本發(fā)明的原理的將經(jīng)轉(zhuǎn)換的SVC運動矢量構(gòu)造成基層運動矢量與增強層運動矢量的矢量和的示例性過程的示圖;圖6是示出根據(jù)本發(fā)明的原理的將經(jīng)轉(zhuǎn)換的SVC變換系數(shù)構(gòu)造成基層變換系數(shù)與增強層變換系數(shù)的相加的示例性過程的示圖;貫穿附圖中相同附圖標記用于指代所例示的實施例的類似特征、元件、組件或部分,除非另外聲明。此外,在現(xiàn)在將參照附圖詳細描述本發(fā)明時,是結(jié)合示例性實施例進行的。發(fā)明詳細描述圖1示出了包括可用在視頻通信系統(tǒng)中的譯碼器110的示例性譯碼系統(tǒng)100。輸入視頻編碼器120產(chǎn)生具有一組特定特性(例如,格式和/或參數(shù)特性)的輸入視頻比特流。譯碼器100轉(zhuǎn)換或更改輸入視頻比特流的特性以生成具有一組不同的期望或目標特性的輸出視頻流。不同組的特性可對應于輸出視頻解碼器130所期望或要求的信號特性。輸出視頻流被提供給輸出視頻解碼器130。在圖1中,編碼器120和解碼器130被示為連接到譯碼器100,例如在現(xiàn)場視頻通信系統(tǒng)中將是這種情形。然而,注意譯碼器110的操作不依賴于信號編碼和解碼操作發(fā)生的精確時間。類似地,藉由其使得輸入視頻比特流可為譯碼器100所用的機制或者藉由其使得輸出視頻比特流可為解碼器130所用的機制不對譯碼器100的操作產(chǎn)生影響,也與之不相關(guān)。實際上,例如,輸入視頻比特流或輸出視頻比特流中的任一個可被存儲在硬盤、RAM 或其他存儲裝置中。編碼器120也可由通過網(wǎng)絡連接傳送預編碼視頻的服務器來替代。類似地,解碼器130可由存儲輸出視頻比特流以備稍后解碼或其它用途的服務器來替代。使得輸入視頻比特流可為譯碼器110所用、或使用譯碼器110的輸出視頻比特流的其它機制是可能的。在此描述的譯碼技術(shù)可獨立于輸入和輸出比特流的源、遞送機制或者使用而被應用于所有情形中。響應于輸入和輸出信號上的給定率約束,譯碼器110的譯碼操作可以是無損或有損的。無損譯碼意味著雖然輸入和輸出信號都服從給定率約束,但兩者是相同的。有損譯碼意味著雖然輸入和輸出信號都服從給定率約束,但兩者是不同的。H. ^4SVC標準(參見例如通過引用全部結(jié)合于此的Wiegand、G. Sullivan、 J. Reichel、H.Schwarz、M. Wien 等人的"Joint Draft5 =Scalable Video Coding(聯(lián)合草案 5 可縮放視頻編碼)”,聯(lián)合視頻小組,Doc. JVT-R201,曼谷,泰國,2005年1月)提供了經(jīng)編碼視頻比特流中的時間、SNR和空間可縮放性。對于譯碼自輸入SVC比特流,對輸出視頻格式考慮以下示例性情形-譯碼成SVC比特流-譯碼成H.洸4比特流-譯碼成H.263, MPEG2、H. 261, MPEG4或任何其它視頻比特流格式(除H. 264和 SVC之外)。對于譯碼成輸出SVC比特流,對輸入視頻格式考慮以下示例性情形-譯碼自SVC比特流-譯碼自H.264比特流-譯碼自H.263, MPEG2、H. 261, MPEG4或任何其它視頻比特流格式(除H. 264和 SVC之外)。對譯碼器110的設計和操作的關(guān)鍵考慮在于,在慮及后繼譯碼過程的情況下,編碼器(例如,編碼器120)是否能夠預計并準備輸入比特流。對于本文的描述,通常假定在 SVC編碼的情形中,輸入視頻比特流是如此準備好的,而在H. 264編碼的情形中,通常是未被如此準備好的。對于H. 263.MPEG2.H. 26UMPEG4或任何其它視頻比特流格式(除H. 264和SVC之外),假定此輸入視頻流未被如此準備好。注意由于這些標準之間的迥然不同, 并不期望編碼器的譯碼過程預計實現(xiàn)簡化的譯碼過程。在圖2中示出了可被譯碼器110采用的譯碼方法或技術(shù)(“全解碼/重編碼譯碼 (FDRT) 200”)。FDRT技術(shù)200涉及比特流中畫面的完全解碼和完全重編碼(即,在輸入視頻解碼器210處從輸入比特流產(chǎn)生經(jīng)解碼的畫面,以及在輸出視頻編碼器220處編碼它們以產(chǎn)生輸出比特流)。與本文所述的其它譯碼技術(shù)(圖3-7等)相比,此技術(shù)是復雜的,并導致較大的延遲。由于這種延遲特性,對于大多數(shù)應用而言,優(yōu)選地避免FDRT技術(shù)。然而, 當輸入視頻信號僅可在有給定比特率約束內(nèi)的較大差異的情況下由輸出視頻比特流表示時,可能需要使用FDRT技術(shù)200。當兩個有關(guān)的編解碼器(輸入和輸出比特流)的解碼過程的較大部分不同時,或者當輸入和輸出比特流特性(例如,空間分辨率、SNR分辨率、編碼決策)基本上不同時,可能有這種情況發(fā)生。在此情形中,全或完全解碼/重編碼過程可能是必需的或可取的,因為輸入視頻編碼器與輸出視頻解碼器之間的顯著漂移會因譯碼操作而被引入。這種漂移對視頻質(zhì)量產(chǎn)生極大影響,并且必需被控制以便使視頻信號可用。對漂移的全控制(即,用于調(diào)節(jié)所涉及的所有輸出比特流編碼參數(shù)的能力)僅在使用全解碼 /重編碼譯碼技術(shù)的情況下才可用。如圖2中所示,在FDRT200中,譯碼系統(tǒng)100可在解碼器210與編碼器220之間有益地使用輔助信息來提升輸出視頻編碼。此輔助信息可包括用在輸入比特流中的宏塊模式判決、量化器值、參考畫面和/或運動矢量。例如,使用輔助信息中的運動矢量不僅可在 FDRT200中有益地消去或減少與視頻編碼相關(guān)聯(lián)的復雜度,而且在本文所描述的運動矢量被用于補償信號轉(zhuǎn)換過程的所有其它譯碼過程中也是如此。在圖3中示出了發(fā)明譯碼方法或技術(shù)(“部分解碼/重編碼譯碼(PDRT) 300”)。 PDRT技術(shù)300涉及輸入視頻解碼器310處輸入比特流中的畫面的部分解碼,以及輸出視頻解碼器320處使用從該輸入比特流獲得的輔助信息的重編碼。在PDRT技術(shù)300中,輸入比特流被解析和更改,并且僅輸入編解碼器的解碼過程和輸出編解碼器的編碼過程的一部分——而非完全鏈——被調(diào)用。PDRT技術(shù)300潛在可能地復雜度較低,并且潛在可能導致比PDRT技術(shù)200更少的延遲。改進的程度可能依賴于相關(guān)編解碼器的解碼過程的相似度以及輸入視頻信號特性與輸出視頻信號特性之間的變化量。PDRT技術(shù)300可被有益地用在其中輸入視頻信號由輸出視頻比特流近似表示的實例中。在此情形中,由譯碼引入的漂移可能是足夠小的,以致僅通過調(diào)節(jié)輸出視頻比特流中的編碼決策的部分、通過輸入視頻編碼器預計譯碼操作或者兩者就可控制它。如圖3中所示,在FDRT300中,譯碼系統(tǒng)100可在解碼器310與編碼器320之間有益地使用輔助信息來提升輸出視頻編碼。此輔助信息可包括用在輸入比特流中的宏塊模式判決、量化器值、參考畫面和運動矢量。在圖4中示出了另一發(fā)明譯碼技術(shù)(“壓縮域譯碼(⑶T)400”)。⑶T技術(shù)300涉及在輸入視頻比特流解析器410處解析輸入視頻比特流的經(jīng)編碼數(shù)據(jù)(輸入視頻語法元素),以及在輸出視頻比特流生成器420處將它們映射到輸出視頻流的經(jīng)編碼數(shù)據(jù)。輸入比特流被解析并更改,但是既不調(diào)用輸入編解碼器的解碼過程也不調(diào)用輸出編解碼器的解碼過程。與FDRT技術(shù)200和PDRT技術(shù)300相比,⑶T技術(shù)400復雜度較低,且通常導致更少的延遲。CDT技術(shù)400可被有益地用在其中輸入視頻信號由輸出視頻比特流精確表示的實例中。在此情形中,可能沒有漂移或者譯碼僅引入極小的漂移,該極小的漂移可通過由輸入視頻編碼器預計譯碼操作來控制。如圖4中所示,在⑶T300中,可在解析器410與生成器420之間有益地使用輔助信息來提升輸入視頻語法元素的映射。該輔助信息可包括輸入比特流的所有語法元素的全部或部分。一般而言,輸入視頻比特流中包括丟棄整個分組的更改或變化不被認為是譯碼技術(shù)。例如,在媒體網(wǎng)關(guān)處消去SVC流中與接收器不期望的時間層相對應的分組不被認為是譯碼操作,而被認為是直接使用比特流的可縮放性特征。一個例外是在提取SVC流的基層并將其轉(zhuǎn)換成AVC兼容流時的情形。基層分組可被封裝成AVC兼容NAL單元或SVC兼容 NAL單元并且在經(jīng)編碼的數(shù)據(jù)中沒有變化。SVC封裝無法通過純AVC(AVC-only)接收器來解碼,因此必須被轉(zhuǎn)換。在此情形中,譯碼器100可使用合適的高級譯碼技術(shù)“傳輸層譯碼”(TLT)。將SVC比特流譯碼成H. 263.MPEG2.H. 26UMPEG4或任何其它視頻比特流格式(除 H. 264和SVC之外)通常要求譯碼使用FDRT技術(shù)來進行。類似地,將H. 263.MPEG2.H. 261, MPEG4或任何其它視頻比特流格式(除H. 264和SVC之外)譯碼成SVC比特流通常要求譯碼使用FDRT技術(shù)來進行。在以下描述了用于SVC到H. 264的譯碼、H. 264到SVC的譯碼、以及SVC到SVC的譯碼的技術(shù)。譯碼操作是由對輸出比特流中某些特性的要求來引導的??紤]以下譯碼類型, 其中括號中的符號被用于標識每種類型-給定所請求的時間分辨率(T)-給定所請求的質(zhì)量分辨率⑴)-給定空間分辨率(S)-給定質(zhì)量和時間分辨率的組合Ο /Τ)-給定空間和時間分辨率的組合(S/T)-給定空間、質(zhì)量和時間分辨率的組合Ol/S/T)對于這些類型的每一種,本文描述了從H. 264到SVC(標示為類型“ + ”)、從SVC到 HJ64(標示為類型“-”)、以及從SVC到SVC(標示為類型“=”)的格式轉(zhuǎn)換。轉(zhuǎn)換類型符號(+、_或=)以及譯碼類型符號(T、Q、S、Q/T、S/T和Q/S/T)可被組合以唯一地標識本文所描述的各種轉(zhuǎn)換情形和譯碼類型組合。例如,符號‘Q/T+’指在給定所請求的組合質(zhì)量和時間分辨率的情況下從H. 264到SVC的譯碼。首先,考慮在特定所請求的輸出視頻信號的時間分辨率的情況下譯碼成輸出比特流的情形(譯碼類型T)。當譯碼成SVC時,請求譯碼成幀間預測(時間可縮放性)的特定依存性結(jié)構(gòu)??臻g和SNR分辨率被認為在輸入與輸出比特流之間相同。H. 264和SVC為表示視頻信號的時間分辨率和幀間預測的依存性結(jié)構(gòu)提供了相同的基本能力。結(jié)果,關(guān)于轉(zhuǎn)換類型+、_和=以及譯碼類型T的譯碼過程選項是相對簡單的,且在本領域中是公知的。對于從SVC到H. 264的譯碼(情形‘T_’),除可縮放內(nèi)容結(jié)構(gòu)的附加信令之外,時間可縮放性與H. 264是后向兼容的。此外,當SVC編碼器例如通過時間可縮放性預計所請求的輸出視頻分辨率時,譯碼過程可使用或者CDT400或者TLT。時間可縮放性是通過幀間預測參考的依存性結(jié)構(gòu)來實現(xiàn)的。對于譯碼,無需用于其它畫面的解碼的畫面可被丟棄。情形‘T-’的譯碼選項在本領域中是眾所周知的。對于從H. 264到SVC的譯碼(情形‘T+,),如果H. 264編碼器不能慮及譯碼,則通常必須使用FDRT200或PDRT300技術(shù)。當H. 264編碼器輸入的時間預測結(jié)構(gòu)與輸出中期望的時間預測結(jié)構(gòu)(藉由其實現(xiàn)時間可縮放性)不匹配時,就是這種情形。當輸入視頻信號的某些時間層與輸出信號的那些相匹配但是兩種信號中的較高時間層的結(jié)構(gòu)不同時,可使用PDRT300技術(shù)。在此情形中,匹配的較低層可在未經(jīng)更改的情況下被使用,但是必須執(zhí)行較高層畫面的解碼和重編碼。如果H. 264編碼器輸入的時間預測結(jié)構(gòu)是期望的輸出時間分辨率的子集,則譯碼器可插入預編碼畫面數(shù)據(jù)(例如,跳躍畫面或跳躍宏塊數(shù)據(jù))以按需形成附加時間可縮放性層,并消去輸入視頻信號中輸出視頻信號所不期望的時間層。這是其中在譯碼器處生成附加數(shù)據(jù)的CDT400的一種形式。如果H. 264編碼器可預計并慮及后續(xù)譯碼操作,以使得輸入時間分辨率與輸出所期望的時間分辨率完全匹配,則可采用其中沒有生成附加數(shù)據(jù)的⑶T400技術(shù)。對于從SVC到SVC譯碼(情形‘T =’),當SVC編碼器預計所請求的輸出視頻分辨率時,可使用如情形‘T+’中所描述的CDT400技術(shù)來進行譯碼。如果編碼器不預計所請求的輸出分辨率,則必須如在情形‘T+’中那樣來使用FDRT。現(xiàn)在,考慮在特定所請求的輸出視頻信號的SNR分辨率的情況下譯碼成輸出比特流的情形(譯碼類型‘Q’)。所請求的輸出視頻信號的SNR分辨率可被假定為低于或等于輸入視頻SNR分辨率。當譯碼成SVC時,還可請求譯碼成一組較低的SNR分辨率(對于SNR 可縮放性)。時間和空間分辨率被認為在輸入與輸出比特流之間相同。注意SVC中SNR分辨率的表示可通過兩種機制——粗粒度可縮放性(CGS)或細粒度可縮放性(FGS)——中的任一種來實現(xiàn)。在兩種機制中,附加“增強”信號被傳送以提升基信號的視頻質(zhì)量。此增強過程可被重復以使得第一增強信號變成基信號,且第二附加增強信號被傳送以提升第一增強/基信號。所重復的增強可以是或者運動矢量改進或者殘余信號改進(對于或者幀間或者幀內(nèi)宏塊),或兩者。注意還可從較低層宏塊預測宏塊類型。運動矢量改進由可被添加到先前所傳送的基運動矢量中從而導致可使用H. 264 語法準確地表示的總計或組合運動矢量的、所傳送的附加運動矢量構(gòu)成。例如,如圖5中所示,基層運動矢量52添加到增強層運動矢量M導致了組合的總計運動矢量56,該運動矢量 56可使用H. 264語法來準確表示。殘余信號改進由被添加到先前所傳送的基變換系數(shù)從而導致可用H. 264語法來近似表示的變換系數(shù)的、所傳送的附加變換系數(shù)構(gòu)成。例如,如圖6中所示,分別添加經(jīng)量化的基和增強層變換系數(shù)62和64導致了 SVC變換系數(shù)幅度。特定QP⑴幅度值可在H. 264 中被準確或不被準確地表示。僅對于QP的特定選擇,組合SVC變換系數(shù)值才可被準確表示。 例如,圖6示出了當量化值如在附圖的右側(cè)的標度上所指示的為5時的準確表示QP(X’ )。 對于另一 QP (QP (X))選擇,如附圖的左側(cè)中所示的,組合SVC變換系數(shù)值落在量化值2與3 之間。幀間宏塊的殘余信號與運動信息彼此相關(guān)聯(lián),即,特定運動矢量必須與特定殘余信號相組合。對于在給定所期望的輸出SNR分辨率的情形下從SVC到H.沈4的譯碼(情形 ‘Q-’),譯碼通常必須使用PDRT300技術(shù)。然而,當組合SVC變換系數(shù)水平合計達可由比特率約束內(nèi)的H. 264變換系數(shù)水平來表示的值時,譯碼可使用CDT400技術(shù)。這種狀況——可由SVC編碼器強制實施——允許更簡單的譯碼器操作。與所請求的SNR分辨率相對應的SVC運動矢量被構(gòu)造(通過將基和增強層運動矢量相加)并由輸出比特流編碼器來重編碼。SVC運動矢量構(gòu)造和重編碼可使用CDT技術(shù)400 來有益地執(zhí)行并且不引入差錯。SVC殘余變換系數(shù),即與所請求的SNR分辨率相對應的SVC變換系數(shù)被構(gòu)造(通過將基和增強層變換系數(shù)相加)并由輸出比特流編碼器來重編碼。此外,如果對SVC編碼器的控制可用,則在CGS與res之間進行區(qū)分是有益的。僅在使用CGS且對SVC編碼器的控制可用的情形中,可作出量化變換系數(shù)的選擇以使得它們具有H. 264語法中的對應物。這種對應通常是H. 264和SVC中的量化器值的差異為6或6的整數(shù)倍時的情形。因此,對于量化器值的這種差異,可使用⑶T400技術(shù)進行譯碼。在一種辦法中,可通過以增加H. 264 比特流的比特流為代價適當?shù)剡x擇H. 264的量化參數(shù)以準確地表示SVC中的變換系數(shù)水平來避免譯碼漂移。在另一種用于避免漂移的辦法中,SVC中的變換系數(shù)重構(gòu)規(guī)則可被更改以便以增加SVC中的比特率為代價實現(xiàn)H. 264中的比特率的高效表示。在兩種辦法中,沒有產(chǎn)生漂移,并且譯碼可使用CDT400來執(zhí)行。如果不使用這兩種辦法中的任一種,則SVC系數(shù)與H. 264系數(shù)之間的差異通常是給定的,且所引入的漂移需要被跟蹤。這可使用PDRT300 技術(shù)來進行。以下進一步例示了以上所考慮的情形。如果輸出比特流編碼器可準確地表示SVC變換系數(shù)(例如,使用如圖6中所示的 QP(X’)),則輸入視頻編碼器與輸出視頻解碼器之間沒有發(fā)生漂移。準確表示可通過或者選擇量化參數(shù)以使得增強層QP與基層QP之間的差異為6的整數(shù)倍、或者通過選擇滿足其準確表示條件的另一組SVC和H. 264量化參數(shù)、或者通過更改SVC重構(gòu)規(guī)則(即,確定如何從基和增強層變換系數(shù)確定最后的變換系數(shù)的規(guī)則)來實現(xiàn)。規(guī)則的更改必須如此進行在給定比特率約束內(nèi)使用H. 264的反向縮放方法來無差錯地表示結(jié)果SVC變換系數(shù)。否則,如果輸出比特流編碼器不能準確地表示SVC變換系數(shù)(例如,使用如圖6中所示的QP(X)),則發(fā)生非期望的漂移。然而,漂移可由輸入視頻編碼器通過預計譯碼操作和該譯碼操作所引入的可能的偏差、或通過適當?shù)膮⒖籍嬅孢x擇或幀內(nèi)編碼來控制。對于 PDRT300和CDT400技術(shù)應用,由輸入視頻編碼器進行的漂移控制可能是較佳的。譯碼操作的預計可導致輸入視頻編碼器選擇可使用H. 264變換系數(shù)語法來準確表示的變換系數(shù)?;蛘?,譯碼操作的預計能夠使得輸入視頻編碼器選擇可使用H. 264變換系數(shù)語法來表示的具有較小誤差的變換系數(shù)。出于這個目的,SVC編碼器知道用所允許的量化器參數(shù)可表示哪些水平。注意這組允許值是由譯碼比特率約束給出的。量化器參數(shù)的較小值允許SVC變換系數(shù)的更精確表示,但是增加了 H. 264輸出比特流的比特流。SVC編碼器常常需要選擇使用哪些量化器值以及使用哪種改進。此類SVC編碼器可有益地作出選擇以便僅具有很小的偏差。共同轉(zhuǎn)讓的國際專利申請No.PCT/US06/(^8365“System and Method forScalable and Low-Delay Videoconferencing Using Scalable Video Coding(用于使用可縮放視步頁編碼的可縮放和低延遲視頻會議的系統(tǒng)和方法)”介紹了作為實現(xiàn)時間可縮放性的手段的時間預測結(jié)構(gòu)中的線程化。此外,共同轉(zhuǎn)讓的國際專利申請No. PCT/US06/061815"Systems and Method for Error Resilience andRandom Access in Video CommunicationSystems (用于視頻通信系統(tǒng)中的差錯彈性和隨機接入的系統(tǒng)和方法),,描述了一般使用可縮放視頻編碼且特別使用線程化預測結(jié)構(gòu)的視頻通信系統(tǒng)中的改進的差錯彈性和隨機接入。后一申請具體描述了 ‘LR’畫面,該畫面是與經(jīng)可縮放編碼的視頻信號的最低時間層相對應的畫面,并且使用諸如重傳等適當?shù)膫鬏攲蛹夹g(shù)被可靠地傳送給接收器。通過預計潛在可能的譯碼,所描述或類似的視頻通信系統(tǒng)中的編碼器可選擇約束與較高時間層畫面(L1、L2、. . .、LN畫面)不同的LR畫面的SVC比特流。對于LR畫面,譯碼方法較佳地被選擇成沒有漂移發(fā)生,從而允許壓縮域譯碼操作(CDT400)。此選擇會導致對LR畫面的某些約束和比特率開銷。或者,如果SVC比特流被構(gòu)造成導致漂移發(fā)生,則漂移必須在PDRT300中被確定并被減輕。對于并非LR畫面的畫面,編碼器可自由地選擇比特流的構(gòu)造,并且通常無需強制變換系數(shù)水平的SVC表示被準確表示或使得沒有漂移發(fā)生。這個原因在于,因為這些(非 LR)畫面在時間上是嵌套的,它們的空時差錯傳播是非常有限的。換言之,用于譯碼的方法 (FDRT、PDRTjDT)可以逐畫面為基礎來選擇。此選擇還可依賴于畫面是LR還是非LR畫面、 或者畫面是否為空間或SNR分辨率下的增強而作出。當使用PDRT300技術(shù)時,譯碼器(例如,譯碼器110)還可自身控制漂移。對于這種控制,譯碼器可通過使用當前畫面的運動矢量來監(jiān)視累積的漂移,并根據(jù)經(jīng)譯碼的(輸出視頻信號)參考畫面與輸入視頻參考畫面之間的差異進行運動補償。在近似當前畫面的 SVC變換系數(shù)時,通過由譯碼器將此運動補償差分信號添加到輸入視頻信號的SVC變換系數(shù)來計及這些運動補償差分信號。此漂移控制方法在本領域中是眾所周知的。對于從H. 264到SVC的譯碼(情形‘Q+,),譯碼通常必須使用PDRT300技術(shù)來進行。在此情形中,可假定除最大輸出視頻質(zhì)量之外,還請求較低輸出視頻質(zhì)量。對于譯碼, H. 264運動矢量可被劃分成各個SVC運動矢量SVC比特流的基層、增強層和(可能的)剩余運動向量。劃分成多個分量可或者在空間上、或者以使得所有SVC運動矢量分量的和提供H. 264運動矢量的形式、或者兩者相組合進行。剩余運動矢量不被作為SVC比特流的部分來傳送。或者,H. 264變換系數(shù)可被劃分成各個SVC變換系數(shù)SVC比特流的基層、增強層和(可能的)剩余變換系數(shù)。劃分成分量可或者在頻率上、或者以使得全部SVC變換系數(shù)分量的和提供H. 264變換系數(shù)的方式、或者兩者相組合進行。剩余系數(shù)不被作為SVC比特流的部分來發(fā)送。以上兩種情形的具體劃分可作為在以下描述的決策率-失真最優(yōu)化算法的部分。率-失真最優(yōu)化算法可為具有比輸入H. 264比特流低的SNR的所有重構(gòu)點確定有效的劃分。在畫面內(nèi),譯碼可能會影響幀內(nèi)編碼部分和可能的幀間編碼部分。對于幀內(nèi)編碼部分,殘余變換系數(shù)可被劃分成基層和增強層變換系數(shù)。注意對于具有與H. 264輸入比特流相等的增強層的兩層示例,基層系數(shù)較佳地由相對于H. 264量化器值而言增大6的量化器值來編碼。這些系數(shù)是通過使用增大6的量化器值來量化H. 264輸入變換系數(shù)來獲得的。通常,在SVC中對量化器值的選擇是由稱為“率-失真最優(yōu)化”(RDO)的過程來決定的。 在此過程中,量化器值可通過使D+ λ *R最小化來選擇。在此,對于譯碼,D對應于H. 264輸入與SVC輸出之間的漂移,R對應于SVC輸出的率,而λ是提供D與R之間的權(quán)衡的拉格朗日參數(shù)(正值)。因此,譯碼器可通過D+λ *R的最小化一這是在輸出表示的各種選項上進行的——來操作。在SVC中,當僅在SVC的基層中進行幀內(nèi)預測時,幀內(nèi)譯碼產(chǎn)生漂移。 用于避免這種漂移的選項是將SVC中的幀內(nèi)預測改變成也使用增強層中的參考樣本。用于幀間編碼的率-失真最優(yōu)化算法中的這種辦法類似于幀內(nèi)編碼中需要控制漂移的譯碼情形。對于幀間編碼,D+λ *R的最小化還包括一組運動矢量。殘余變換系數(shù)被劃分成基層和增強層變換系數(shù)。注意對于具有與H. 264輸入比特流相等的增強層的兩層示例,基層系數(shù)通常由相對于H. 264量化器值而言增大6的量化器值來編碼。這些是通過使用增大6的量化器值來量化H. 264輸入變換系數(shù)來獲得的。運動矢量還被劃分成基層和增強層運動矢量。如前所述,對量化器值的選擇是通過RDO過程來決定的,其中量化器值通過最小化D+λ *R來選擇。在此,對于譯碼,D對應于H. 264輸入與SVC輸出之間的漂移,R 對應于SVC輸出的率,而λ是提供D與R之間的權(quán)衡的拉格朗日參數(shù)(正值)。因此,譯碼器可通過使D+ λ *R最小化的辦法——這是在輸出表示的各種選項上進行的——來操作??傃灾瑸榱藴蕚溥M行譯碼,SVC編碼器需要閉合針對輸出所請求的、與H. 264輸入分辨率不同的各種SNR分辨率的混合式編碼環(huán)路。各種SNR分辨率對應于劃分H. 264運動矢量和H. 264變換系數(shù)。因此,對于特定SNR分辨率(其與輸入分辨率不相等),在運動補償SNR分辨率與當前SNR分辨率之間產(chǎn)生漂移。此漂移歸咎于錯失SVC變換系數(shù),該漂移將被跟蹤并被補償以避免視頻失真。此外,可調(diào)節(jié)SVC編碼器中去塊濾波器的使用以最小化漂移。在本發(fā)明中,跟蹤是在每個層內(nèi)執(zhí)行的,且率-失真最優(yōu)化被用于最優(yōu)化性能。對于從SVC到SVC的譯碼(情形‘Q =,),譯碼必須使用PDRT300。可假定除比最大輸入視頻質(zhì)量低的最大輸出視頻質(zhì)量之外,還請求較低的輸出視頻質(zhì)量。當較低輸出視頻質(zhì)量與較低輸入視頻質(zhì)量相同時,最高視頻質(zhì)量的譯碼類似于率成形或者以上針對從 H. 264到SVC譯碼(情形‘Q+’ )所提及的最優(yōu)化算法。情形‘'Q =’中的不同之處在于, H. 264的變換系數(shù)或變換系數(shù)預測差錯還可包括最高層的系數(shù)改進,并且類似地,H. 264的運動矢量和運動矢量預測差錯也可包括最高層的運動矢量改進。在SVC到SVC的所有其它譯碼情形中存在類似不同點。注意如果輸出視頻信號的要求是需要在譯碼之前丟棄輸入視頻信號的多個較高層(例如,期望比最高時間可縮放性層低),則譯碼器也可如此進行。現(xiàn)在,考慮在特定所請求的輸出視頻信號的分辨率的情況下譯碼成輸出比特流的情形(譯碼類型‘S’)??杉俣ó斪g碼成SVC時,還可能請求譯碼成一組較低的空間分辨率 (對于空間可縮放性)。時間和SNR分辨率可被認為在輸入與輸出比特流之間相同。在SVC中多個空間分辨率的表示是以與SNR可縮放性類似的方式實現(xiàn)的(即,通過宏塊類型、運動矢量、幀內(nèi)內(nèi)容和幀間編碼殘余的預測)。多個空間分辨率的表示中僅僅不同之處在于,經(jīng)編碼的較低層的數(shù)據(jù)需要被縮放或上采樣至期望的較高分辨率以便被使用。宏塊類型和運動矢量預測是設計成縮減比特率的無損方法,并且可使用H. 264語法來準確表示。運動矢量改進由可被添加到先前被傳送并縮放的基運動矢量從而導致可使用 H. 264語法準確地表示的運動矢量的、所傳送的附加運動矢量構(gòu)成。幀內(nèi)內(nèi)容預測上采樣來自基層的經(jīng)幀內(nèi)編碼的信號;基層信號可以是遵循H.沈4的內(nèi)宏塊的預測,或者它可以是遵循SVC的內(nèi)宏塊的表示,如以下所述的。注意遵循H.沈4的內(nèi)宏塊包括或者基于乜4、8訪或者16x16亮度(Iuma)像素塊大小操作的、跟隨有經(jīng)編碼的殘余信號、任選地跟隨有內(nèi)宏塊的去塊的空間預測器 (predictor)。遵循SVC的內(nèi)宏塊包括跟隨有作為SNR增強添加到由經(jīng)上采樣的遵循H. 264或遵循SVC的內(nèi)宏塊形成的預測器的殘余信號的遵循H. 264的內(nèi)宏塊。使用來自或者遵循 H. 264或者遵循SVC的內(nèi)宏塊的預測編碼的遵循SVC的宏塊的變換系數(shù)可使用H. 264語法來近似地表示。幀間編碼殘余預測上采樣來自基層的、跟隨有作為SNR增強被添加到預測器的殘余信號的幀內(nèi)編碼殘余。對于從SVC到H. 264的譯碼(情形‘S-,),譯碼通常必須使用PDRT300技術(shù)來進行。對于譯碼,最接近所請求的H. 264空間分辨率的SVC空間層被從比特流提取。如果此 SVC層的空間分辨率與所請求的H. 264空間分辨率相等(可由預計譯碼的SVC編碼器來確定),則譯碼可使用PDRT300技術(shù)。否則,如果兩個層的空間分辨率不相同,則譯碼可能需要
全解碼/重編碼操作。對于使用部分解碼/重編碼操作(例如使用PDRT300技術(shù))的譯碼的情形,不能使用H. 264語法表示的宏塊需要被譯碼。這些宏塊主要是具有htra BL(內(nèi)塊)預測和殘余預測的那些。結(jié)果變換系數(shù)需要使用H. 264語法來逼近。此外,對于此情形,漂移需要由譯碼器來控制。這可以與以上針對給定輸出質(zhì)量分辨率(情形‘Q-’)的從SVC到H.沈4的譯碼所描述的那些相類似的方式來進行。對于控制漂移,輸入與輸出之間的差分可針對給定率約束通過對每個層應用的率-失真最優(yōu)化算法來最小化。這些算法可類似于以上所描述的算法,并且可能的變量通常是量化參數(shù)(對于幀間和幀內(nèi)編碼)和運動矢量(對于僅幀間編碼)。對于從H. 264到SVC的譯碼(情形‘S+,),譯碼必須使用FDRT200過程來進行。然而,來自H. 264的某些運動矢量可被重用以提升譯碼過程。當進行從SVC到SVC的譯碼(情形‘S = ’)時,可使用FDRT200或在可能情況下使用PDRT300過程來進行??杉俣ㄔ诖饲樾沃?,所請求的輸出視頻分辨率可比可用輸入視頻分辨率小或大(例如,將CSVCS中的一個視頻信號的畫面大小增大20% )。形成譯碼的基礎的輸入空間分辨率被選擇成使得對于所請求的輸出分辨率而言它是最接近的較低空間分辨率。譯碼過程包括以根據(jù)該較低分辨率的適當縮放因子(例如,20%)創(chuàng)建預測器。 要被編碼的原始信號或者是經(jīng)上采樣的較低分辨率信號或者是經(jīng)下采樣的較高分辨率信號(如果可用)。SVC重編碼可通過重用較低層預測信息和被編碼以補償漂移的殘余來實現(xiàn)。通常,可避免運動估計。現(xiàn)在,考慮在特定所請求的輸出視頻信號的SNR和時間分辨率的情況下譯碼成輸出比特流的情形(譯碼類型‘Q/T’)??杉俣ㄔ诖饲樾沃校斪g碼成SVC時,可請求譯碼成一組較低的SNR和時間分辨率(對于SNR和時間可縮放性)。空間分辨率可被認為在輸入與輸出比特流之間相同。對于從SVC到H. 264的譯碼(情形‘Q/T_’ ),可假定SVC編碼器預計所請求的時間輸出分辨率。用于譯碼情形‘Q-’的方法和技術(shù)由此可在情形‘Q/T-’中應用。對于從H. 264到SVC的譯碼(情形‘Q/T+,),譯碼必須使用FDRT200操作來進行, 除非在H. 264輸入比特流中使用分層時間預測結(jié)構(gòu)。如果使用分層時間預測結(jié)構(gòu),則適用于Q+譯碼情形的譯碼方法和技術(shù)可被應用,包括PDRT300技術(shù),或逐畫面切換地應用各譯碼技術(shù)。如果沒有分層時間預測結(jié)構(gòu)被使用,則譯碼器可插入這種分層時間預測結(jié)構(gòu),因為它提升了 SNR可縮放性的編碼效率。
對于從SVC到SVC的譯碼(情形‘Q/T = ’),可假定SVC編碼器預計所請求的時間輸出分辨率。用于情形‘Q =,的方法由此可在情形‘Q/T =,中應用。當使用可縮放時間層時,譯碼技術(shù)的混合一壓縮域?qū)嵤├?例如⑶T400技術(shù)) 和全解碼/重編碼實施例/部分解碼/重編碼實施例(例如,F(xiàn)RDT200和PRDT300技術(shù))—— 可能是實用的且是可取的。例如,來自SVC的時間基層可被復制,且時間增強層可用部分解碼/重編碼實施例/壓縮域?qū)嵤├齺碜g碼,或者用諸如跳躍畫面的其它預編碼比特流來替代?,F(xiàn)在,考慮在特定所請求的輸出視頻信號的空間和時間分辨率的情況下譯碼成輸出比特流的情形(譯碼類型‘s/τ’)??杉俣ó斪g碼成SVC時,還可能請求譯碼成一組較低的空間和時間分辨率(對于空間和時間可縮放性)。SNR分辨率可被認為在輸入與輸出比特流之間相同。對于從SVC到H. 264的譯碼(情形‘S/T_’ ),可假定SVC編碼器預計所請求的時間輸出分辨率。適用于情形‘S-’的譯碼方法由此可應用于情形‘S/T-’。對于從H. 264到SVC的譯碼(情形‘S/Τ+,),譯碼必須使用FDRT200操作來進行。對于從SVC到SVC的譯碼(情形‘S/T = ’),可假定SVC編碼器預計所請求的時間輸出分辨率。適用于情形‘S =,的譯碼方法由此可應用于情形‘S/T =’。最后,考慮譯碼情形‘S/Q/T’。根據(jù)本發(fā)明的原理,這種情形的譯碼可作為類型 ‘Q/T’、繼之以‘S’或‘S/Τ’、繼之以‘Q’的組合應用來解決。已在本文中描述了情形‘Q/T’、 ‘S’、‘S/Τ’和‘Q’的情形。因此,出于簡便起見,不再重復情形‘S/Q/T’的譯碼的描述。所有所描述的組合的譯碼器可被操作以使得其插入增大或降低比特流的差錯彈性的語法元素。這些語法元素可包括宏塊模式(幀內(nèi)、幀間)、幀內(nèi)預測信號、運動矢量或殘余變換系數(shù)。此外,譯碼器可將切片添加到比特流或從其移除切片。用于所有所描述組合的譯碼器可調(diào)節(jié)要通過不同網(wǎng)絡傳送的比特流。這些網(wǎng)絡包括RTP/IP、ISDN和H. 324M電路交換網(wǎng)絡。譯碼器可針對語法元素而調(diào)節(jié)差錯彈性、更改切片大小以調(diào)節(jié)MTU大小約束或傳輸差錯,或者出于其它原因而進行更改。用于所有所描述組合的譯碼器可調(diào)節(jié)比特流以遵循SVC和H. 264的不同概況。當輸出比特流遵循SVC標準時,譯碼器還可與CSVCS功能(在共同轉(zhuǎn)讓的國際專利申請NO.PCT/US06/62569中描述)組合。在此配置中,譯碼器可通過接收多個輸入比特流(經(jīng)H. 261, H. 263, H. 264或SVC編碼的)并在使用標準CSVCS技術(shù)將它們合成為單個 SVC輸出比特流之前應用本文所描述的所有所述轉(zhuǎn)換技術(shù)(T+、Q+、S+、Q/T+、S/T+、S/Q/T+) 來操作。盡管本文描述的優(yōu)選實施例使用H. ^HSVC草案標準,但是對于本領域技術(shù)人員而言,這些技術(shù)可直接應用于提供空間、質(zhì)量、時間可縮放性的任何編碼結(jié)構(gòu)是顯而易見的。應當理解,根據(jù)本發(fā)明,本文所描述的譯碼技術(shù)可使用硬件和軟件的任何合適組合來實現(xiàn)。用于實現(xiàn)和操作前述譯碼技術(shù)的軟件(即,指令)可被設置在計算機可讀介質(zhì)上,這些計算機可讀介質(zhì)可包括但不限于固件、存儲器、存儲設備、微控制器、微處理器、集成電路、ASICS、可在線下載的媒體以及其它可用介質(zhì)。
權(quán)利要求
1.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸入視頻編碼格式是SVC,而所述譯碼器的所述輸出視頻編碼格式是H. 264,并且其中所述譯碼器被配置成解碼和組合被單獨編碼在不同層中的所述至少數(shù)字視頻信號輸入的各個層編碼參數(shù),以及將所述經(jīng)組合的參數(shù)編碼成所述至少一個輸出數(shù)字視頻信號上的單一值,以使得所述至少一個數(shù)字視頻信號輸出具有低于或等于所述輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
4.如權(quán)利要求1所述的系統(tǒng),其特征在于,為了使譯碼漂移最小化,周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的至少一個被用在所述輸入視頻信號的編碼中。
5.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”);至少一個輸入視頻編碼器;以及電子通信網(wǎng)絡,它鏈接所述至少一個輸入視頻編碼器與所述譯碼器,其中所述輸入視頻編碼器的所述視頻編碼格式是SVC,所述譯碼器的所述輸入視頻編碼格式是SVC,而所述譯碼器的所述輸出視頻編碼格式是H. 264,其中所述輸入視頻編碼器還被配置成使得對于包含在經(jīng)SVC編碼的數(shù)據(jù)中的至少一個畫面,所述經(jīng)SVC編碼的數(shù)據(jù)可通過H. 264準確表示,并且其中所述譯碼器還被配置成解碼和組合被單獨編碼在不同層中的所述至少一個輸入信號的各個層編碼參數(shù),以及將所述經(jīng)組合的參數(shù)編碼成所述至少一個輸出視頻信號上的單一值,以使得所述至少一個輸出視頻信號具有低于或等于所述輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
6.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
7.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
8.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述輸入視頻編碼器還被配置成使得連續(xù) SVC層中塊的所述變換系數(shù)數(shù)據(jù)中的QP差為6的倍數(shù)。
9.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述輸入視頻編碼器還被配置成使得對于至少最低時間層(LR)畫面,經(jīng)SVC編碼的數(shù)據(jù)可通過H. 264準確表示。
10.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”);其中所述譯碼器的所述輸入視頻編碼格式是H. 264,而所述譯碼器的所述輸出視頻編碼格式是SVC ;并且其中所述譯碼器被配置成將所述至少一個輸入信號的各個層編碼參數(shù)劃分成多個分量,并且將所述多個分量的全部或僅一部分單獨地編碼在所述至少一個輸出視頻信號的不同層上,以使得所述至少一個輸出視頻信號至少具有低于所述輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述經(jīng)劃分的變換系數(shù)數(shù)據(jù)的分量包括以下至少之一與不同頻率相對應的系數(shù)數(shù)據(jù);當加在一起時產(chǎn)生原始系數(shù)數(shù)據(jù)值的多組值;以及其組合
13.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述至少一個輸出視頻信號的所述層內(nèi)的所述變換系數(shù)數(shù)據(jù)的所述編碼是以連續(xù)層中塊內(nèi)的QP差是6的倍數(shù)的形式來進行的。
14.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
15.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述經(jīng)劃分的運動矢量數(shù)據(jù)的分量包括以下至少之一與不同空間位置相對應的運動矢量數(shù)據(jù);當加在一起時產(chǎn)生原始運動矢量數(shù)據(jù)的多組值;以及其任何組合。
16.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述譯碼器還被配置成在具有與該層內(nèi)的漂移相對應的失真的每個層內(nèi)使用率-失真最優(yōu)化來劃分所述至少一個輸入信號的各個層編碼參數(shù)。
17.如權(quán)利要求10所述的系統(tǒng),其特征在于,為了消去譯碼漂移,所述輸入視頻信號的所述編碼格式還被配置成使用增強層中的參考樣本來執(zhí)行幀內(nèi)預測。
18.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸入視頻編碼格式是SVC,其中所述譯碼器的所述輸出視頻編碼格式是SVC,并且包含除所述輸入視頻編碼格式的最高層之外的所述輸入視頻編碼格式的相同空間、時間和質(zhì)量分辨率,以及其中所述譯碼器被配置成將所述至少一個輸入信號的所述最高層的各個編碼參數(shù)劃分成多個分量,并且將所述多個分量的全部或僅一部分單獨地編碼在所述至少一個輸出視頻信號的不同層上,以使得所述至少一個輸出視頻信號至少具有低于所述至少一個輸入視頻信號的所述最高層的所述質(zhì)量分辨率的期望質(zhì)量分辨率。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)及其改進中的至少一者。
20.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述經(jīng)劃分的變換系數(shù)數(shù)據(jù)包括以下至少之一與不同頻率相對應的變換系數(shù)或其改進;當加在一起時產(chǎn)生原始系數(shù)或改進值的多組值;以及其任何組合。
21.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述至少一個輸出視頻信號的所述層內(nèi)的所述變換系數(shù)或其改進的所述編碼是以連續(xù)層中塊內(nèi)的QP差為6的倍數(shù)的形式來進行的。
22.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)及其改進。
23.如權(quán)利要求22所述的系統(tǒng),其特征在于,所述經(jīng)劃分的運動矢量分量包括以下至少之一與不同空間位置相對應的運動矢量或其改進;當加在一起時產(chǎn)生原始運動矢量或運動矢量改進的多組值;以及其組合。
24.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述譯碼器還配置成在具有與該層內(nèi)的漂移相對應的失真的每個層內(nèi)使用率-失真最優(yōu)化來劃分所述至少一個輸入信號的各個層編碼參數(shù)。
25.如權(quán)利要求18所述的系統(tǒng),其特征在于,為了消去譯碼漂移,所述輸入視頻信號的所述編碼格式還被配置成使用增強層中的參考樣本來執(zhí)行幀內(nèi)預測。
26.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸入視頻編碼格式是SVC,其中所述譯碼器的所述輸出視頻編碼格式是具有在所述輸入視頻編碼格式所提供的多個空間分辨率當中的空間分辨率的 H.沈4,并且其中所述譯碼器被配置成解碼和組合被單獨編碼在不同層中的所述至少一個輸入信號的各個層編碼參數(shù),以及當?shù)葍r語法在所述輸出視頻編碼格式中可用時將所述經(jīng)組合的參數(shù)編碼成所述至少一個輸出視頻信號上的單一值,并且當準確編碼在所述輸出視頻編碼格式中不可用時將所述經(jīng)組合的參數(shù)的近似編碼成所述至少一個輸出視頻信號。
27.如權(quán)利要求沈所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
28.如權(quán)利要求沈所述的系統(tǒng),其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
29.如權(quán)利要求沈所述的系統(tǒng),其特征在于,所述譯碼器還配置成使用率-失真最優(yōu)化來編碼所述至少一個輸入視頻信號的所述經(jīng)組合的參數(shù)的近似,其中所述失真對應于所述漂移。
30.如權(quán)利要求沈所述的系統(tǒng),其特征在于,為了使譯碼漂移最小化,周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的一個被用在所述輸入視頻信號的編碼中。
31.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸入視頻編碼格式是SVC,其中所述譯碼器的所述輸出視頻編碼格式是SVC,并包含所述輸入視頻編碼格式的相同時間和質(zhì)量分辨率,以及所述輸入視頻編碼格式當中高達并包括與所述輸出視頻編碼格式的期望最高空間分辨率(“期望輸出分辨率”)最接近的一個分辨率(“最接近輸入分辨率”)的空間分辨率,并且其中所述譯碼器被配置成按需將具有所述最接近輸入分辨率的所述輸入視頻信號層上采樣或下采樣至所述期望輸出分辨率,以及用來自具有所述最接近的輸入分辨率的所述輸入視頻信號層的所述經(jīng)編碼的數(shù)據(jù)的預測器來編碼所述經(jīng)上采樣或下采樣的數(shù)據(jù),所述預測器可被適當?shù)乜s放至所述期望輸出分辨率并包括被編碼以補償所述引入的漂移的殘余。
32.如權(quán)利要求31所述的系統(tǒng),其特征在于,所述譯碼器還被配置成使用率-失真最優(yōu)化來編碼所述殘余,其中所述失真對應于所述漂移。
33.如權(quán)利要求31所述的系統(tǒng),其特征在于,為了使譯碼漂移最小化,周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的至少一個被用在所述輸入視頻信號的編碼中。
34.如權(quán)利要求31所述的系統(tǒng),其特征在于,所述預測器包括運動矢量數(shù)據(jù),并且其中所述至少一個輸出視頻信號的所述編碼是在不執(zhí)行任何附加運動估計的情況下進行的。
35.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸入視頻編碼格式支持時間可縮放性,其中所述譯碼器的所述輸出視頻編碼格式支持時間可縮放性,并且所述輸入視頻編碼格式的時間分辨率的至少之一被包括在所述輸出視頻編碼格式的期望時間分辨率中,并且其中所述譯碼器被配置成通過消去所述至少一個輸入視頻信號中與任何期望輸出時間分辨率不相對應的不必要時間層、當畫面數(shù)據(jù)對應于期望輸出時間分辨率時在所述至少一個輸出視頻信號中復制來自所述至少一個輸入視頻信號的所述數(shù)據(jù)、以及針對在所述至少一個輸入視頻信號中不存在的期望輸出時間分辨率傳送預編碼信息來產(chǎn)生所述至少一個輸出視頻信號的期望時間分辨率集合。
36.如權(quán)利要求35所述的系統(tǒng),其特征在于,所述預編碼信息包括跳躍數(shù)據(jù)。
37.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式是SVC,而所述輸出視頻編碼格式是H.沈4,所述方法包括解碼和組合被單獨編碼在不同層中的所述至少一個數(shù)字視頻信號輸入的各個層編碼參數(shù);以及將所述經(jīng)組合的參數(shù)編碼成所述至少一個輸出視頻信號中的單一值,以使得所述至少一個數(shù)字視頻信號輸出具有低于或等于輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
38.如權(quán)利要求37所述的方法,其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
39.如權(quán)利要求37所述的方法,其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
40.如權(quán)利要求37所述的方法,其特征在于,還包括在所述輸入視頻信號的編碼中使用周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的至少一個以使譯碼漂移最小化。
41.一種用于編碼通往用于在譯碼器處譯碼成至少一個數(shù)字視頻信號輸出的所述譯碼器的電子通信網(wǎng)絡上的至少一個數(shù)字視頻信號輸入的方法,其中所述輸入視頻編碼格式是 SVC,而所述輸出視頻編碼格式是H. 264,所述方法包括針對包含在經(jīng)SVC編碼的數(shù)據(jù)中的至少一個畫面,將所述至少一個數(shù)字視頻信號輸入編碼成可通過H. 264準確表示的經(jīng)SVC編碼的數(shù)據(jù);以及在所述譯碼器處解碼和組合被單獨編碼在不同層中的所述至少一個輸入信號的各個層編碼參數(shù),以及將所述經(jīng)組合的參數(shù)組合成所述至少一個輸出視頻信號中的單一值,以使得所述至少一個輸出視頻信號具有低于或等于所述輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
42.如權(quán)利要求41所述的方法,其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
43.如權(quán)利要求41所述的方法,其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
44.如權(quán)利要求41所述的方法,其特征在于,還包括編碼成使得連續(xù)SVC層中塊的所述變換系數(shù)數(shù)據(jù)中的QP差為6的倍數(shù)。
45.如權(quán)利要求41所述的方法,其特征在于,還包括編碼成使得對于至少所述最低時間層(LR)畫面,經(jīng)SVC編碼的數(shù)據(jù)可通過H. 264準確表示。
46.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式是SVC,而所述輸出視頻編碼格式是H.沈4,所述方法包括將所述至少一個輸入信號的各個層編碼參數(shù)劃分成多個分量;以及將所述多個分量的全部或僅一部分單獨地編碼在所述至少一個輸出視頻信號的不同層上,以使得所述至少一個輸出視頻信號至少具有低于輸入質(zhì)量分辨率的期望質(zhì)量分辨率。
47.如權(quán)利要求46所述的方法,其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
48.如權(quán)利要求47所述的方法,其特征在于,所述經(jīng)劃分的變換系數(shù)數(shù)據(jù)的分量包括以下至少之一與不同頻率相對應的系數(shù)數(shù)據(jù);當加在一起時產(chǎn)生原始系數(shù)數(shù)據(jù)值的多組值;以及其組合
49.如權(quán)利要求47所述的方法,其特征在于,所述至少一個輸出視頻信號的所述層內(nèi)的所述變換系數(shù)數(shù)據(jù)的所述編碼是以連續(xù)層中塊內(nèi)的QP差為6的倍數(shù)的形式來進行的。
50.如權(quán)利要求46所述的方法,其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
51.如權(quán)利要求50所述的方法,其特征在于,所述經(jīng)劃分的運動矢量數(shù)據(jù)的分量包括以下至少之一與不同空間位置相對應的運動矢量數(shù)據(jù);當加在一起時產(chǎn)生原始運動矢量數(shù)據(jù)的多組值;以及其組合。
52.如權(quán)利要求46所述的方法,其特征在于,劃分所述至少一個輸入信號的各個層編碼參數(shù)包括在具有與該層內(nèi)的漂移相對應的失真的每個層內(nèi)使用率-失真最優(yōu)化。
53.如權(quán)利要求46所述的方法,其特征在于,為了消去譯碼漂移,所述輸入視頻信號的所述編碼格式還被配置成使用增強層中的參考樣本來執(zhí)行幀內(nèi)預測。
54.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式是SVC,其中所述輸出視頻編碼格式是SVC并包含除所述輸入視頻編碼格式的最高層之外的所述輸入視頻編碼格式的相同空間、時間和質(zhì)量分辨率,所述方法包括將所述至少一個輸入信號的所述最高層的各個層編碼參數(shù)劃分成多個分量;以及將所述多個分量的全部或僅一部分單獨地編碼在所述至少一個輸出視頻信號的不同層上,以使得所述至少一個輸出視頻信號至少具有低于所述至少一個輸入視頻信號的所述最高層的所述質(zhì)量分辨率的期望質(zhì)量分辨率。
55.如權(quán)利要求M所述的方法,其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)及其改進中的至少一者。
56.如權(quán)利要求55所述的方法,其特征在于,所述經(jīng)劃分的變換系數(shù)數(shù)據(jù)包括以下至少之一與不同頻率相對應的變換系數(shù)或其改進;當加在一起時產(chǎn)生原始系數(shù)或改進值的多組值;以及其組合。
57.如權(quán)利要求55所述的方法,其特征在于,所述至少一個輸出視頻信號的所述層內(nèi)的所述變換系數(shù)或其改進的所述編碼是以連續(xù)層中塊內(nèi)的QP差為6的倍數(shù)的形式來進行的。
58.如權(quán)利要求M所述的方法,其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)及其改進。
59.如權(quán)利要求58所述的方法,其特征在于,所述經(jīng)劃分的運動矢量分量包括以下至少之一與不同空間位置相對應的運動矢量或其改進;當加在一起時產(chǎn)生原始運動矢量或運動矢量改進的多組值;以及其組合。
60.如權(quán)利要求M所述的方法,其特征在于,劃分所述至少一個輸入信號的各個層編碼參數(shù)包括在具有與該層內(nèi)的漂移相對應的失真的每個層內(nèi)使用率-失真最優(yōu)化。
61.如權(quán)利要求M所述的方法,其特征在于,為了消去譯碼漂移,所述輸入視頻信號的所述編碼格式被配置成使用增強層中的參考樣本來執(zhí)行幀內(nèi)預測。
62.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式是SVC,其中所述輸出視頻編碼格式是具有在所述輸入視頻編碼格式所提供的多個空間分辨率中的空間分辨率的H.沈4,所述方法包括解碼和組合被單獨編碼在不同層中的所述至少一個輸入信號的各個層編碼參數(shù);以及當?shù)葍r語法在所述輸出視頻編碼格式中可用時將所述經(jīng)組合的參數(shù)編碼成所述至少一個輸出視頻信號上的單一值,并且當準確編碼在所述輸出視頻編碼格式中不可用時將所述經(jīng)組合的參數(shù)的近似編碼成所述至少一個輸出視頻信號。
63.如權(quán)利要求62所述的方法,其特征在于,所述各個編碼參數(shù)包括變換系數(shù)數(shù)據(jù)。
64.如權(quán)利要求62所述的方法,其特征在于,所述各個編碼參數(shù)包括運動矢量數(shù)據(jù)。
65.如權(quán)利要求62所述的方法,其特征在于,編碼所述至少一個輸入視頻信號的所述經(jīng)組合的參數(shù)的近似包括使用率-失真最優(yōu)化,其中所述失真對應于所述漂移。
66.如權(quán)利要求62所述的方法,其特征在于,為了使譯碼漂移最小化,在所述輸入視頻信號的編碼中使用周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的一個。
67.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式是SVC,其中所述輸出視頻編碼格式是SVC并包含所述輸入視頻編碼格式的相同時間和質(zhì)量分辨率,以及所述輸入視頻編碼格式當中高達并包括與所述輸出視頻編碼格式的期望最高空間分辨率(“期望輸出分辨率”)最接近的一個分辨率(“最接近輸入分辨率”)的空間分辨率,所述方法包括按需將具有所述最接近輸入分辨率的所述輸入視頻信號層上采樣或下采樣至所述期望輸出分辨率;以及使用來自具有所述最接近輸入分辨率的所述輸入視頻信號層的所述經(jīng)編碼的數(shù)據(jù)的預測器來編碼所述經(jīng)上采樣或下采樣的數(shù)據(jù),所述預測器可被適當?shù)乜s放至所述期望輸出分辨率并包括被編碼以補償所述引入的漂移的殘余。
68.如權(quán)利要求67所述的方法,其特征在于,還包括使用率-失真最優(yōu)化來編碼所述殘余,其中所述失真對應于所述漂移。
69.如權(quán)利要求67所述的方法,其特征在于,還包括為了使譯碼漂移最小化,在所述輸入視頻信號的編碼中使用周期性內(nèi)宏塊和線程化時間預測結(jié)構(gòu)中的一個。
70.如權(quán)利要求67所述的方法,其特征在于,所述預測器包括運動矢量數(shù)據(jù),并且其中所述至少一個輸出視頻信號的所述編碼是在不執(zhí)行任何附加運動估計的情況下進行的。
71.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸入視頻編碼格式支持時間可縮放性,其中所述輸出視頻編碼格式支持時間可縮放性,并且所述輸入視頻編碼格式的時間分辨率的至少之一被包括在所述輸出視頻編碼格式的期望時間分辨率中,所述方法還包括通過以下操作來產(chǎn)生所述至少一個輸出視頻信號的期望時間分辨率集合消去所述至少一個輸入視頻信號中與任何期望輸出時間分辨率不相對應的不必要時間層;當畫面數(shù)據(jù)對應于期望輸出時間分辨率時在所述至少一個輸出視頻信號中復制來自所述至少一個輸入視頻信號的所述數(shù)據(jù);以及針對在所述至少一個輸入視頻信號中不存在的期望輸出時間分辨率傳送預編碼信息。
72.如權(quán)利要求71所述的方法,其特征在于,所述預編碼信息包括跳躍數(shù)據(jù)。
73.一種數(shù)字視頻信號處理系統(tǒng),包括具有至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的視頻處理單元(“譯碼器”),其中所述譯碼器的所述輸出視頻編碼格式支持時間可縮放性,并且其中所述譯碼器被配置成通過在畫面數(shù)據(jù)對應于期望輸出時間分辨率時在所述至少一個輸出視頻信號中復制來自所述至少一個輸入視頻信號的所述數(shù)據(jù)、以及解碼來自所述至少一個輸入視頻信號的畫面數(shù)據(jù)并針對所述至少一個輸入視頻信號中不存在的期望輸出時間分辨率將它們編碼在所述輸出視頻信號中來產(chǎn)生所述至少一個輸出視頻信號的期望時間分辨率集合。
74.如權(quán)利要求73所述的系統(tǒng),其特征在于,所述輸出視頻信號時間分辨率被線程化。
75.一種用于譯碼至少一個數(shù)字視頻信號輸入和至少一個數(shù)字視頻信號輸出的方法, 其中所述輸出視頻編碼格式支持時間可縮放性,所述方法包括通過以下操作來產(chǎn)生所述至少一個輸出視頻信號的期望時間分辨率集合在畫面數(shù)據(jù)對應于期望輸出時間分辨率時在所述至少一個輸出視頻信號中復制來自所述至少一個輸入視頻信號的所述數(shù)據(jù);以及解碼來自所述至少一個輸入視頻信號的畫面數(shù)據(jù)并將它們重編碼到所述至少一個輸出視頻信號以產(chǎn)生所述至少一個輸入視頻信號中不存在的期望輸出時間分辨率。
76.如權(quán)利要求76所述的方法,其特征在于,所述輸出視頻信號時間分辨率被線程化。
77.包括用于執(zhí)行權(quán)利要求36-72和75-76中的任一項的步驟的可執(zhí)行指令集的計算機可讀介質(zhì)。
全文摘要
提供了用于在使用可縮放視頻編碼的視頻通信系統(tǒng)中執(zhí)行譯碼的系統(tǒng)和方法。此系統(tǒng)和方法被用于將具有特定特性的輸入信號譯碼或轉(zhuǎn)換成具有不同特性要求的期望輸出信號。取決于輸入和期望輸出信號的具體特性,這些系統(tǒng)和方法是基于壓縮域處理、部分解碼-重編碼、或使用輔助信息的全解碼-重編碼的。
文檔編號H04B1/66GK102318202SQ200780011922
公開日2012年1月11日 申請日期2007年3月29日 優(yōu)先權(quán)日2006年3月29日
發(fā)明者A·埃爾夫瑟里阿迪斯, D·洪, O·夏皮羅, T·維格安德 申請人:維德約股份有限公司