日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

使用節(jié)目信息或子流結(jié)構(gòu)元數(shù)據(jù)的音頻編碼器和解碼器的制造方法

文檔序號(hào):2826107閱讀:277來(lái)源:國(guó)知局
使用節(jié)目信息或子流結(jié)構(gòu)元數(shù)據(jù)的音頻編碼器和解碼器的制造方法
【專(zhuān)利摘要】一種用于包括通過(guò)將子流結(jié)構(gòu)元數(shù)據(jù)(SSM)和/或節(jié)目信息元數(shù)據(jù)(PIM)以及音頻數(shù)據(jù)包括在比特流中來(lái)生成編碼音頻比特流的設(shè)備和方法。其他方面是用于對(duì)這樣的比特流進(jìn)行解碼的設(shè)備和方法,以及被配置成(例如,被編程成)執(zhí)行該方法的任意實(shí)施方式或包括存儲(chǔ)根據(jù)該方法的任意實(shí)施方式而生成的音頻比特流的至少一個(gè)幀的緩沖存儲(chǔ)器的音頻處理單元(例如,編碼器、解碼器或后處理器)。
【專(zhuān)利說(shuō)明】使用節(jié)目信息或子流結(jié)構(gòu)元數(shù)據(jù)的音頻編碼器和解碼器

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻信號(hào)處理,以及更具體地,涉及具有指示與由比特流所指示的音 頻內(nèi)容有關(guān)的子流結(jié)構(gòu)和/或節(jié)目信息的元數(shù)據(jù)的音頻數(shù)據(jù)比特流的編碼和解碼。本發(fā)明 的一些實(shí)施方式以被稱(chēng)為杜比數(shù)字(AC-3)、杜比數(shù)字+ (增強(qiáng)的AC-3或E-AC-3)或杜比E 的格式中的一種格式生成或解碼音頻數(shù)據(jù)。

【背景技術(shù)】
[0002] 杜比、杜比數(shù)字、杜比數(shù)字+、和杜比E是杜比實(shí)驗(yàn)室特許公司的商標(biāo)。杜比實(shí)驗(yàn)室 提供分別被稱(chēng)為杜比數(shù)字和杜比數(shù)字+的AC-3和E-AC-3的專(zhuān)有實(shí)現(xiàn)。
[0003] 音頻數(shù)據(jù)處理單元通常以盲方式(blind fashion)操作并且不關(guān)注在數(shù)據(jù)被接 收之前發(fā)生的音頻數(shù)據(jù)的處理歷史。這可以在這樣的處理框架中工作:其中單個(gè)實(shí)體進(jìn) 行各種目標(biāo)媒體渲染裝置的所有的音頻數(shù)據(jù)處理和編碼而目標(biāo)媒體渲染裝置進(jìn)行編碼音 頻數(shù)據(jù)的所有的解碼和渲染。然而,該盲處理在多個(gè)音頻處理單元跨多樣化的網(wǎng)絡(luò)被散布 (scatter)或串聯(lián)(S卩,鏈)放置并且期望它們最佳地執(zhí)行其相應(yīng)類(lèi)型的音頻處理的情形下 不能很好地(或完全不)工作。例如,一些音頻數(shù)據(jù)可能針對(duì)高性能媒體系統(tǒng)被編碼,并且可 能需要被轉(zhuǎn)換成適合于沿著媒體處理鏈的移動(dòng)設(shè)備的簡(jiǎn)化形式。因此,音頻處理單元可能 不必要地對(duì)音頻數(shù)據(jù)執(zhí)行已經(jīng)被執(zhí)行過(guò)的類(lèi)型的處理。例如,音量校平(leveling)單元可 能對(duì)輸入音頻片斷執(zhí)行處理,不管以前是否已經(jīng)對(duì)輸入音頻片斷執(zhí)行了相同的或相似的音 量校平。因此,即使當(dāng)不必要時(shí),音量校平單元也可能執(zhí)行校平。該不必要的處理還可能導(dǎo) 致當(dāng)渲染音頻數(shù)據(jù)的內(nèi)容時(shí)具體特征的退化和/或消除。


【發(fā)明內(nèi)容】

[0004] 在一類(lèi)實(shí)施方式中,本發(fā)明是能夠?qū)幋a比特流進(jìn)行解碼的音頻處理單元,該編 碼比特流包括比特流的至少一個(gè)幀的至少一個(gè)段中的子流結(jié)構(gòu)元數(shù)據(jù)和/或節(jié)目信息元 數(shù)據(jù)(可選地還包括其他元數(shù)據(jù),例如,響度處理狀態(tài)元數(shù)據(jù))以及幀的至少一個(gè)其他段中 的音頻數(shù)據(jù)。在本文中,子流結(jié)構(gòu)元數(shù)據(jù)(或"SSM")表示編碼比特流(或編碼比特流的集合) 的元數(shù)據(jù),其指示編碼比特流的音頻內(nèi)容的子流結(jié)構(gòu),并且"節(jié)目信息元數(shù)據(jù)"(或"PM") 表示編碼音頻比特流的元數(shù)據(jù),其指示至少一個(gè)音頻節(jié)目(例如,兩個(gè)或更多個(gè)音頻節(jié)目), 其中節(jié)目信息元數(shù)據(jù)指示至少一個(gè)所述節(jié)目的音頻內(nèi)容的至少一個(gè)屬性或特性(例如,指 示對(duì)節(jié)目的音頻數(shù)據(jù)執(zhí)行的處理的類(lèi)型或參數(shù)的元數(shù)據(jù),或指示節(jié)目的哪些通道是活動(dòng)通 道(active channel)的元數(shù)據(jù))。
[0005] 在典型的情況(例如,其中編碼比特流為AC-3或E-AC-3比特流)下,節(jié)目信息元數(shù) 據(jù)(PIM)指示實(shí)際上不能在比特流的其他部分中攜帶的節(jié)目信息。例如,PIM可以指示在編 碼(例如,AC-3或E-AC-3編碼)之前對(duì)PCM音頻所應(yīng)用的處理,音頻節(jié)目的哪些頻帶已經(jīng)使 用具體的音頻編碼技術(shù)被編碼以及用于在比特流中創(chuàng)建動(dòng)態(tài)范圍壓縮(DRC)數(shù)據(jù)的壓縮配 置文件(profile)。
[0006] 在另一類(lèi)實(shí)施方式中,方法包括在比特流的每個(gè)幀(或至少一些幀中的每個(gè)幀)中 將編碼音頻數(shù)據(jù)與SSM和/或PIM復(fù)用的步驟。在典型的解碼中,解碼器從比特流中提取 SSM和/或PM (包括通過(guò)對(duì)SSM和/或PM以及音頻數(shù)據(jù)進(jìn)行分析和去復(fù)用),并且對(duì)音 頻數(shù)據(jù)進(jìn)行處理以生成解碼音頻數(shù)據(jù)的流(以及在某些情況下還執(zhí)行音頻數(shù)據(jù)的自適應(yīng)處 理)。在一些實(shí)施方式中,解碼音頻數(shù)據(jù)以及SSM和/或PM從解碼器被轉(zhuǎn)發(fā)至后處理器, 該后處理器被配置成使用SSM和/或PM對(duì)解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理。
[0007] 在一類(lèi)實(shí)施方式中,本發(fā)明的編碼方法生成包括音頻數(shù)據(jù)段(例如,圖4所示的幀 的ABO至AB5段或圖7所示的幀的段ABO至AB5中的全部或一些)的編碼音頻比特流(例如, AC-3或E-AC-3比特流),音頻數(shù)據(jù)段包括編碼音頻數(shù)據(jù)以及與音頻數(shù)據(jù)段時(shí)分復(fù)用的元數(shù) 據(jù)段(包括SSM和/或PIM,可選地還包括其他元數(shù)據(jù))。在一些實(shí)施方式中,每個(gè)元數(shù)據(jù)段 (在本文中有時(shí)稱(chēng)為"容器")具有包括元數(shù)據(jù)段報(bào)頭(可選地還包括其他強(qiáng)制性的或"核心" 元素)、以及在元數(shù)據(jù)段報(bào)頭之后的一個(gè)或更多個(gè)元數(shù)據(jù)有效載荷。如果存在,SIM被包括在 元數(shù)據(jù)有效載荷之一中(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有第一類(lèi)型的格式)。如果存在, PM被包括在元數(shù)據(jù)有效載荷中的另一個(gè)中(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有第二類(lèi)型 的格式)。類(lèi)似地,元數(shù)據(jù)的每個(gè)其他類(lèi)型(如果存在)被包括在元數(shù)據(jù)有效載荷中的另一個(gè) 中(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有特定于元數(shù)據(jù)的類(lèi)型的格式)。示例性格式允許在 除了比特流的解碼期間之外的時(shí)間(例如,由解碼之后的后處理器,或由被配置成在不執(zhí)行 對(duì)編碼比特流的完全解碼的情況下識(shí)別元數(shù)據(jù)的處理器)對(duì)SSM、PIM或其他元數(shù)據(jù)的方便 的訪(fǎng)問(wèn),并且允許在比特流的解碼期間(例如,子流識(shí)別的)方便的和高效的誤差檢測(cè)和校 正。例如,在不以示例性格式訪(fǎng)問(wèn)SSM的情況下,解碼器可能錯(cuò)誤地識(shí)別與節(jié)目相關(guān)聯(lián)的子 流的正確數(shù)量。元數(shù)據(jù)段中的一個(gè)元數(shù)據(jù)有效載荷可以包括SSM,元數(shù)據(jù)段中的另一元數(shù)據(jù) 有效載荷可以包括PM,并且可選地,元數(shù)據(jù)段中的至少一個(gè)其他元數(shù)據(jù)有效載荷可以包括 其他元數(shù)據(jù)(例如,響度處理狀態(tài)元數(shù)據(jù)或"LPSM")。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0008] 圖1是可以被配置成執(zhí)行本發(fā)明的方法的實(shí)施方式的系統(tǒng)的實(shí)施方式的框圖。
[0009] 圖2是作為本發(fā)明的音頻處理單元的實(shí)施方式的編碼器的框圖。
[0010] 圖3是作為本發(fā)明的音頻處理單元的實(shí)施方式的解碼器以及作為本發(fā)明的音頻 處理單元的另一實(shí)施方式的耦接至解碼器的后處理器的框圖。
[0011] 圖4是包括被劃分成的段的AC-3幀的圖。
[0012] 圖5是包括被劃分成的段的AC-3幀的同步信息(SI)段的圖。
[0013] 圖6是包括被劃分成的段的AC-3幀的比特流信息(BSI)段的圖。
[0014] 圖7是包括被劃分成的段的E-AC-3幀的圖。
[0015] 圖8是根據(jù)本發(fā)明的實(shí)施方式生成的包括元數(shù)據(jù)段報(bào)頭的編碼比特流的元數(shù)據(jù) 段的圖,元數(shù)據(jù)段報(bào)頭包括容器同步字(在圖8中標(biāo)識(shí)為"容器同步")以及版本和鍵ID值, 之后是多個(gè)元數(shù)據(jù)有效載荷以及保護(hù)位。
[0016] 符號(hào)和術(shù)語(yǔ)
[0017] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"對(duì)"信號(hào)或數(shù)據(jù)執(zhí)行操作(例如,對(duì)信號(hào)或 數(shù)據(jù)進(jìn)行濾波、縮放、變換或施加增益)的表達(dá)用于廣義上表示對(duì)信號(hào)或數(shù)據(jù)、或?qū)π盘?hào)或 數(shù)據(jù)的已處理版本(例如,對(duì)在對(duì)信號(hào)執(zhí)行操作之前已經(jīng)經(jīng)歷了初步濾波或預(yù)處理的信號(hào) 的版本)直接執(zhí)行操作。
[0018] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"系統(tǒng)"的表達(dá)用于廣義上表示設(shè)備、系統(tǒng) 或子系統(tǒng)。例如,實(shí)現(xiàn)解碼器的子系統(tǒng)可以稱(chēng)為解碼器系統(tǒng),并且包括這樣的子系統(tǒng)的系統(tǒng) (例如,響應(yīng)于多個(gè)輸入生成X個(gè)輸出信號(hào)的系統(tǒng),在該系統(tǒng)中,子系統(tǒng)生成M個(gè)輸入并且其 他X - M個(gè)輸入從外部源接收)也可以稱(chēng)為解碼器系統(tǒng)。
[0019] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,術(shù)語(yǔ)"處理器"用于廣義上表示可編程或以 其他方式可配置成(例如,使用軟件或固件)對(duì)數(shù)據(jù)(例如,音頻數(shù)據(jù)或視頻數(shù)據(jù)或其他圖像 數(shù)據(jù))執(zhí)行操作的系統(tǒng)或裝置。處理器的示例包括現(xiàn)場(chǎng)可編程門(mén)陣列(或其他可配置的集成 電路或芯片組)、被編程和/或被以其他方式配置成對(duì)音頻數(shù)據(jù)或其他聲音數(shù)據(jù)執(zhí)行流水線(xiàn) 處理的數(shù)字信號(hào)處理器、可編程的通用處理器或計(jì)算機(jī)以及可編程的微處理器芯片或芯片 組。
[0020] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"音頻處理器"和"音頻處理單元"的表達(dá)用 于可交換地廣義上表示被配置成對(duì)音頻數(shù)據(jù)進(jìn)行處理的系統(tǒng)。音頻處理單元的示例包括但 不限于編碼器(例如,代碼轉(zhuǎn)換器)、解碼器、編解碼器、預(yù)處理系統(tǒng)、后處理系統(tǒng)以及比特流 處理系統(tǒng)(有時(shí)稱(chēng)為比特流處理工具)。
[0021] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,(編碼音頻比特流的)"元數(shù)據(jù)"的表達(dá)指代 與比特流的相應(yīng)的音頻數(shù)據(jù)分離的且不同的數(shù)據(jù)。
[0022] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"子流結(jié)構(gòu)元數(shù)據(jù)"(或"SSM")的表達(dá)表示 編碼音頻比特流(或編碼音頻比特流集)的元數(shù)據(jù),其指示編碼比特流的音頻內(nèi)容的子流結(jié) 構(gòu)。
[0023] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"節(jié)目信息元數(shù)據(jù)"(或"PM")的表達(dá)表示 編碼音頻比特流的元數(shù)據(jù),該編碼音頻比特流指示至少一個(gè)音頻節(jié)目(例如,兩個(gè)或更多個(gè) 音頻節(jié)目),其中所述元數(shù)據(jù)指示至少一個(gè)所述節(jié)目的音頻內(nèi)容的至少一個(gè)屬性或特性(例 如,指示對(duì)節(jié)目的音頻數(shù)據(jù)執(zhí)行的處理的類(lèi)型或參數(shù)的元數(shù)據(jù)、或表示節(jié)目的哪些通道是 活動(dòng)通道的元數(shù)據(jù))。
[0024] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"處理狀態(tài)元數(shù)據(jù)"的表達(dá)(例如,如在"響 度處理狀態(tài)元數(shù)據(jù)"的表達(dá)中)指代與比特流的音頻數(shù)據(jù)相關(guān)聯(lián)的(編碼音頻比特流的)元 數(shù)據(jù),指示相應(yīng)的(相關(guān)聯(lián)的)音頻數(shù)據(jù)的處理狀態(tài)(例如,已經(jīng)對(duì)音頻數(shù)據(jù)執(zhí)行了什么類(lèi)型 的處理),并且通常還指示音頻數(shù)據(jù)的至少一個(gè)特征或特性。處理狀態(tài)元數(shù)據(jù)與音頻數(shù)據(jù)的 關(guān)聯(lián)是時(shí)間同步的。從而,當(dāng)前的(最新接收或更新的)處理狀態(tài)元數(shù)據(jù)指示相應(yīng)的音頻數(shù) 據(jù)同時(shí)包括所指示的類(lèi)型的音頻數(shù)據(jù)處理的結(jié)果。在一些情況下,處理狀態(tài)元數(shù)據(jù)可以包 括處理歷史和/或用于所指示的類(lèi)型的處理中的和/或從所指示的類(lèi)型的處理中得到的參 數(shù)中的一些或全部。另外,處理狀態(tài)元數(shù)據(jù)可以包括相應(yīng)的音頻數(shù)據(jù)的已經(jīng)從音頻數(shù)據(jù)中 計(jì)算或提取的至少一個(gè)特征或特性。處理狀態(tài)元數(shù)據(jù)還可以包括與相應(yīng)的音頻數(shù)據(jù)的任何 處理無(wú)關(guān)的或不是從相應(yīng)的音頻數(shù)據(jù)的任何處理中得到的其他元數(shù)據(jù)。例如,第三方數(shù)據(jù)、 跟蹤信息、標(biāo)識(shí)符、所有權(quán)或標(biāo)準(zhǔn)信息、用戶(hù)注釋數(shù)據(jù)、用戶(hù)偏好數(shù)據(jù)等可以通過(guò)具體的音 頻處理單元被添加以傳遞至其他音頻處理單元。
[0025] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"響度處理狀態(tài)元數(shù)據(jù)"(或"LPSM")的表 達(dá)表示處理狀態(tài)元數(shù)據(jù),處理狀態(tài)元數(shù)據(jù)指示相應(yīng)的音頻數(shù)據(jù)的響度處理狀態(tài)(例如,已經(jīng) 對(duì)音頻數(shù)據(jù)執(zhí)行了什么類(lèi)型的響度處理),并且通常還指示相應(yīng)的音頻數(shù)據(jù)的至少一個(gè)特 征或特性(例如,響度)。響度處理狀態(tài)元數(shù)據(jù)可以包括不是(即,當(dāng)單獨(dú)考慮時(shí))響度處理狀 態(tài)元數(shù)據(jù)的數(shù)據(jù)(例如,其他元數(shù)據(jù))。
[0026] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"通道"(或"音頻通道")的表達(dá)表示單通 道音頻信號(hào)。
[0027] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"音頻節(jié)目"的表達(dá)表示一個(gè)或更多個(gè)音頻 通道的集合以及可選地還表示相關(guān)聯(lián)的元數(shù)據(jù)(例如,描述期望的空間音頻表示的元數(shù)據(jù)、 和/或PM、和/或SSM、和/或LPSM、和/或節(jié)目邊界元數(shù)據(jù))。
[0028] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,"節(jié)目邊界元數(shù)據(jù)"的表達(dá)表示編碼音頻比 特流的元數(shù)據(jù),其中編碼音頻比特流指示至少一個(gè)音頻節(jié)目(例如,兩個(gè)或更多個(gè)節(jié)目),并 且節(jié)目邊界元數(shù)據(jù)指示至少一個(gè)所述音頻節(jié)目的至少一個(gè)邊界(開(kāi)始和/或結(jié)束)在比特流 中的位置。例如,(指示音頻節(jié)目的編碼音頻比特流的)節(jié)目邊界元數(shù)據(jù)可以包括指示節(jié)目 的開(kāi)始的位置(例如,比特流的第"N"幀的開(kāi)始,或比特流的第"N"幀的第"M"個(gè)樣本位置) 的元數(shù)據(jù),以及指示節(jié)目的結(jié)束的位置(例如,比特流的第"J"幀的開(kāi)始,或比特流的第"J" 幀的第"K"個(gè)樣本位置)的額外元數(shù)據(jù)。
[0029] 貫穿包括權(quán)利要求在內(nèi)的本公開(kāi)內(nèi)容,術(shù)語(yǔ)"耦接"或"被耦接"用于表示直接或 間接連接。從而,如果第一設(shè)備耦接至第二設(shè)備,該連接可以是通過(guò)直接連接,或經(jīng)由其他 設(shè)備和連接的通過(guò)間接連接。

【具體實(shí)施方式】
[0030] 典型的音頻數(shù)據(jù)流包括音頻內(nèi)容(例如,音頻內(nèi)容的一個(gè)或更多個(gè)通道)和指示音 頻內(nèi)容的至少一個(gè)特性的元數(shù)據(jù)兩者。例如,在A(yíng)C-3比特流中,存在具體意在用于改變被 傳送至收聽(tīng)環(huán)境的節(jié)目的聲音的若干音頻元數(shù)據(jù)參數(shù)。元數(shù)據(jù)參數(shù)中的一個(gè)為DIALN0RM 參數(shù),其意在指示音頻節(jié)目中的對(duì)白的平均電平,并且用于確定音頻回放信號(hào)電平。
[0031] 在包括一系列不同的音頻節(jié)目段(每個(gè)具有不同的DIALN0RM參數(shù))的比特流的回 放期間,AC-3解碼器使用每個(gè)段的DIALN0RM參數(shù)執(zhí)行一種類(lèi)型的響度處理,在該響度處理 中AC-3解碼器修改回放電平或響度,使得該系列段的對(duì)白的感知的響度處于一致的電平。 一系列編碼音頻項(xiàng)目中的每個(gè)編碼音頻段(項(xiàng)目)將(通常)具有不同的DIALN0RM參數(shù),并 且解碼器將對(duì)項(xiàng)目中的每個(gè)項(xiàng)目的電平進(jìn)行縮放,使得每個(gè)項(xiàng)目的對(duì)白的回放電平或響度 相同或非常相似,盡管這會(huì)要求在回放期間對(duì)項(xiàng)目中的不同的項(xiàng)目應(yīng)用不同量的增益。
[0032] DIALN0RM通常由用戶(hù)設(shè)置而不是自動(dòng)生成的,然而如果用戶(hù)沒(méi)有設(shè)置值則存在默 認(rèn)的DIALN0RM值。例如,內(nèi)容創(chuàng)建者可以使用AC-3編碼器外部的裝置進(jìn)行響度測(cè)量,然后 將該結(jié)果(指示音頻節(jié)目的口語(yǔ)對(duì)白的響度)傳送至編碼器以設(shè)置DIALN0RM值。從而,依賴(lài) 于內(nèi)容創(chuàng)建者正確地設(shè)置DIALN0RM參數(shù)。
[0033] 對(duì)于為什么AC-3比特流中的DIALN0RM參數(shù)會(huì)是錯(cuò)誤的,存在幾個(gè)不同的原因。第 一,如果DIALN0RM值不是由內(nèi)容創(chuàng)建者設(shè)置的,那么每個(gè)AC-3編碼器具有在比特流的生成 期間使用的默認(rèn)的DIALN0RM值。該默認(rèn)值可能與音頻的實(shí)際對(duì)白響度顯著不同。第二,即 使內(nèi)容創(chuàng)建者測(cè)量響度并且相應(yīng)地設(shè)置DIALN0RM值,可能已經(jīng)使用不符合推薦的AC-3響 度測(cè)量方法的響度測(cè)量算法或計(jì)量器,產(chǎn)生不正確的DIALNORM值。第三,即使已經(jīng)使用由 內(nèi)容創(chuàng)建者正確測(cè)量和設(shè)置的DIALN0RM值創(chuàng)建了 AC-3比特流,該AC-3比特流可能在比特 流的傳輸和/或存儲(chǔ)期間已經(jīng)被改變成錯(cuò)誤值。例如,這在使用錯(cuò)誤的DIALNORM元數(shù)據(jù)信 息解碼、修改然后重新編碼AC-3比特流的電視廣播應(yīng)用中并非是不常見(jiàn)的。從而,包括在 AC-3比特流中的DIALNORM值可能是錯(cuò)誤的或不準(zhǔn)確的,因此可能對(duì)收聽(tīng)體驗(yàn)的質(zhì)量有消 極的影響。
[0034] 此外,DIALNORM參數(shù)不指示相應(yīng)的音頻數(shù)據(jù)的響度處理狀態(tài)(例如,已經(jīng)對(duì)音頻數(shù) 據(jù)執(zhí)行了什么類(lèi)型的響度處理)。響度處理狀態(tài)元數(shù)據(jù)(以其在本發(fā)明的一些實(shí)施方式中被 提供的格式)有助于以尤其高效的方式便利于音頻比特流的自適應(yīng)響度處理和/或音頻內(nèi) 容的響度處理狀態(tài)和響度的有效性的驗(yàn)證。
[0035] 盡管本發(fā)明不限于使用AC-3比特流、E-AC-3比特流或杜比E比特流,為了方便, 將在生成、解碼或以其他方式處理這樣的比特流的實(shí)施方式中對(duì)其進(jìn)行描述。
[0036] AC-3編碼比特流包括元數(shù)據(jù)和音頻內(nèi)容的1至6個(gè)通道。音頻內(nèi)容是已經(jīng)使用感 知音頻編碼壓縮的音頻數(shù)據(jù)。元數(shù)據(jù)包括意在用于改變被傳送至收聽(tīng)環(huán)境的節(jié)目的聲音的 若干音頻元數(shù)據(jù)參數(shù)。
[0037] AC-3編碼音頻比特流的每幀包含關(guān)于數(shù)字音頻的1536個(gè)樣本的音頻內(nèi)容和元數(shù) 據(jù)。對(duì)于48kHz的采樣率,這表示32毫秒的數(shù)字音頻或音頻的每秒31. 25幀的速率。
[0038] 取決于幀是否分別包含1塊、2塊、3塊或6塊音頻數(shù)據(jù),E-AC-3編碼音頻比特流的 每幀包含關(guān)于數(shù)字音頻的256、512、768或1536個(gè)樣本的音頻數(shù)據(jù)和元數(shù)據(jù)。對(duì)于48kHz的 采樣率,這分別表示5. 333、10. 667、16或32毫秒的數(shù)字音頻或分別表示音頻的每秒189. 9、 93. 75、62· 5或3L 25幀的速率。
[0039] 如圖4所示,每個(gè)AC-3幀被劃分成部分(段),包括:包含(如圖5所示)同步字(SW) 和兩個(gè)誤差校正字中的第一個(gè)誤差校正字(CRCl)的同步信息(SI)部分;包含大部分元數(shù) 據(jù)的比特流信息(BSI)部分;包含數(shù)據(jù)壓縮音頻內(nèi)容(以及還可以包括元數(shù)據(jù))的6個(gè)音頻 塊(ΑΒ0至AB5);包含在壓縮音頻內(nèi)容之后剩余的任意未使用的位的無(wú)用位段(W)(也稱(chēng)為 "跳過(guò)字段;可以包含更多元數(shù)據(jù)的輔助(AUX)信息部分;以及兩個(gè)誤差校正字中的第二 個(gè)誤差校正字(CRC2)。
[0040] 如圖7所示,每個(gè)E-AC-3幀被劃分成部分(段),包括:包含(如圖5所示)同步字 (SW)的同步信息(SI)部分;包含大部分元數(shù)據(jù)的比特流信息(BSI)部分;包含數(shù)據(jù)壓縮音 頻內(nèi)容(以及還可以包括元數(shù)據(jù))的6個(gè)音頻塊(ABO至AB5);包含在壓縮音頻內(nèi)容之后剩 余的任意未使用的位的無(wú)用位段(W)(也稱(chēng)為"跳過(guò)字段")(盡管僅示出了一個(gè)無(wú)用位段, 不同的無(wú)用位段或跳過(guò)字段段通??梢栽诿總€(gè)音頻塊之后);可以包含更多元數(shù)據(jù)的輔助 (AUX)信息部分;以及誤差校正字(CRC)。
[0041] 在A(yíng)C-3 (或E-AC-3)比特流中,存在具體意在用于改變被傳送至收聽(tīng)環(huán)境的節(jié)目 的聲音的若干音頻元數(shù)據(jù)參數(shù)。元數(shù)據(jù)參數(shù)中的一個(gè)為DIALNORM參數(shù),該DIALNORM參數(shù) 被包括在BSI段中。
[0042] 如圖6所示,AC-3幀的BSI段包括指示節(jié)目的DIALNORM值的5位參數(shù) ("DIALNORM")。如果AC-3幀的音頻編碼模式("acmod")為0,則包括指示在同一 AC-3幀中 攜帶的第二音頻節(jié)目的5位參數(shù)DIALNORM值的5位參數(shù)("DIALN0RM2"),指示使用雙單通 道或"1+1"通道配置。
[0043] BSI段還包括指示在"addbsie"位之后額外的比特流信息的存在(或不存在) 的標(biāo)志(" addbsie ")、指示在" addbsi 1 "值之后任何額外的比特流信息的長(zhǎng)度的參數(shù) ("addbsil")、以及在"addbsil"值之后高達(dá)64位的額外的比特流信息("addbsi")。
[0044] BSI段包括在圖6中沒(méi)有具體示出的其他元數(shù)據(jù)值。
[0045] 根據(jù)一類(lèi)實(shí)施方式,編碼比特流指示音頻內(nèi)容的多個(gè)子流。在一些情況下,子流指 示多通道節(jié)目的音頻內(nèi)容,并且子流中的每個(gè)指示節(jié)目的通道中的一個(gè)或更多個(gè)。在其他 情況下,編碼音頻比特流的多個(gè)子流指示若干音頻節(jié)目--通常為"主"音頻節(jié)目(可以是 多通道節(jié)目)和至少一個(gè)其他音頻節(jié)目(例如,為關(guān)于主音頻節(jié)目的評(píng)論的節(jié)目)--的音 頻內(nèi)容。
[0046] 指示至少一個(gè)音頻節(jié)目的編碼音頻比特流需要包括音頻內(nèi)容的至少一個(gè)"獨(dú)立" 子流。獨(dú)立子流指示音頻節(jié)目的至少一個(gè)通道(例如,獨(dú)立子流可以指示常規(guī)的5. 1通道音 頻節(jié)目的5個(gè)全音域通道)。在本文中,該音頻節(jié)目稱(chēng)為"主"節(jié)目。
[0047] 在一些類(lèi)型的實(shí)施方式中,編碼音頻比特流指示兩個(gè)或更多個(gè)音頻節(jié)目("主"節(jié) 目和至少一個(gè)其他音頻節(jié)目)。在這樣的情況下,比特流包括兩個(gè)或更多個(gè)獨(dú)立子流:指示 主節(jié)目的至少一個(gè)通道的第一獨(dú)立子流;以及指示另一音頻節(jié)目(與主節(jié)目不同的節(jié)目)的 至少一個(gè)通道的至少一個(gè)其他獨(dú)立子流。每個(gè)獨(dú)立子流可以獨(dú)立地被解碼,并且解碼器可 以操作以?xún)H對(duì)編碼比特流的獨(dú)立子流的子集(不是全部)進(jìn)行解碼。
[0048] 在指示兩個(gè)獨(dú)立子流的編碼音頻比特流的典型示例中,獨(dú)立子流中的一個(gè)指示多 通道主節(jié)目的標(biāo)準(zhǔn)格式揚(yáng)聲器通道(例如,5. 1通道主節(jié)目的左、右、中、左環(huán)繞、右環(huán)繞全音 域揚(yáng)聲器通道),而另一獨(dú)立子流指示關(guān)于主節(jié)目的單通道音頻評(píng)論(例如,導(dǎo)演關(guān)于電影 的評(píng)論,其中主節(jié)目是電影的聲帶(soundtrack))。在指示多個(gè)獨(dú)立子流的編碼音頻比特流 的另一示例中,獨(dú)立子流中的一個(gè)指示包括第一語(yǔ)言的對(duì)白的多通道主節(jié)目(例如,5. 1通 道主節(jié)目)的標(biāo)準(zhǔn)格式揚(yáng)聲器通道(例如,主節(jié)目的揚(yáng)聲器通道中的一個(gè)可以指示對(duì)白),而 每個(gè)其他獨(dú)立子流指示對(duì)白的單通道翻譯(翻譯成不同的語(yǔ)言)。
[0049] 可選地,指示主節(jié)目(可選地還指示至少一個(gè)其他音頻節(jié)目)的編碼音頻比特流包 括音頻內(nèi)容的至少一個(gè)"從屬"子流。每個(gè)從屬子流與比特流的一個(gè)獨(dú)立子流相關(guān)聯(lián),并且 指示其內(nèi)容由相關(guān)聯(lián)的獨(dú)立子流指示的節(jié)目(例如,主節(jié)目)的至少一個(gè)額外的通道(即,從 屬子流指示節(jié)目的不是由相關(guān)聯(lián)的獨(dú)立子流指示的至少一個(gè)通道,而相關(guān)聯(lián)的獨(dú)立子流指 示節(jié)目的至少一個(gè)通道)。
[0050] 在包括獨(dú)立子流(指示主節(jié)目的至少一個(gè)通道)的編碼比特流的示例中,比特流還 包括指示主節(jié)目的一個(gè)或更多個(gè)額外的揚(yáng)聲器通道的(與獨(dú)立子流相關(guān)聯(lián)的)從屬子流。這 樣的額外的揚(yáng)聲器通道對(duì)由獨(dú)立子流指示的主節(jié)目通道來(lái)說(shuō)是額外的。例如,如果獨(dú)立子 流指示7. 1通道主節(jié)目的左、右、中、左環(huán)繞、右環(huán)繞全音域揚(yáng)聲器通道,那么從屬子流可以 指示主節(jié)目的其他兩個(gè)全音域揚(yáng)聲器通道。
[0051 ] 根據(jù)E-AC-3標(biāo)準(zhǔn),E-AC-3比特流必須指示至少一個(gè)獨(dú)立子流(例如,單個(gè)AC-3比 特流),并且可以指示高達(dá)8個(gè)獨(dú)立子流。E-AC-3比特流的每個(gè)獨(dú)立子流可以與高達(dá)8個(gè)從 屬子流相關(guān)聯(lián)。
[0052] E-AC-3比特流包括指示比特流的子流結(jié)構(gòu)的元數(shù)據(jù)。例如,E-AC-3比特流的比 特流信息(BSI)部分中的"chanmap"字段確定由比特流的從屬子流指示的節(jié)目通道的通 道映射。然而,指示子流結(jié)構(gòu)的元數(shù)據(jù)常規(guī)地以如下格式包括在E-AC-3比特流中:該格式 使得便于僅由E-AC-3解碼器訪(fǎng)問(wèn)和使用(在編碼E-AC-3比特流的解碼期間);不便于在解 碼之后(例如,由后處理器)或解碼之前(例如,由被配置成識(shí)別元數(shù)據(jù)的處理器)訪(fǎng)問(wèn)和使 用。而且,存在以下風(fēng)險(xiǎn):解碼器可能使用常規(guī)地包括的元數(shù)據(jù)錯(cuò)誤地識(shí)別常規(guī)的E-AC-3 編碼比特流的子流,并且在本發(fā)明之前還不知道如何以這樣的格式在編碼比特流(例如,編 碼E-AC-3比特流)中包括子流結(jié)構(gòu)元數(shù)據(jù),使得允許在比特流的解碼期間方便和高效的檢 測(cè)和校正子流識(shí)別中的誤差。
[0053] E-AC-3比特流還可以包括關(guān)于音頻節(jié)目的音頻內(nèi)容的元數(shù)據(jù)。例如,指示音頻 節(jié)目的E-AC-3比特流包括指示已經(jīng)使用譜擴(kuò)展處理(以及通道耦合編碼)以對(duì)節(jié)目的內(nèi) 容進(jìn)行編碼的最小頻率和最大頻率的元數(shù)據(jù)。然而,這樣的元數(shù)據(jù)通常以如下格式包括在 E-AC-3比特流中,該格式使得便于僅由E-AC-3解碼器訪(fǎng)問(wèn)和使用(在編碼E-AC-3比特流的 解碼期間);不便于在解碼之后(例如,由后處理器)或解碼之前(例如,由被配置成識(shí)別元數(shù) 據(jù)的處理器)訪(fǎng)問(wèn)和使用。而且,這樣的元數(shù)據(jù)不以如下的格式包括在E-AC-3比特流中,該 格式允許在比特流的解碼期間這樣的元數(shù)據(jù)的識(shí)別的方便和高效的誤差檢測(cè)和誤差校正。
[0054] 根據(jù)本發(fā)明的典型的實(shí)施方式,PM和/或SSM (以及可選地還有其他元數(shù)據(jù),例 如,響度處理狀態(tài)元數(shù)據(jù)或"LPSM")被嵌入在音頻比特流的元數(shù)據(jù)段的一個(gè)或更多個(gè)保留 字段(或槽(slot))中,該音頻比特流還包括其他段(音頻數(shù)據(jù)段)中的音頻數(shù)據(jù)。通常,t匕 特流的每個(gè)幀的至少一個(gè)段包括P頂或SSM,并且?guī)闹辽僖粋€(gè)其他段包括相應(yīng)的音頻數(shù) 據(jù)(即,其數(shù)據(jù)結(jié)構(gòu)由SSM指示的和/或其至少一個(gè)特性或?qū)傩杂蒔IM指示的音頻數(shù)據(jù))。
[0055] 在一類(lèi)實(shí)施方式中,每個(gè)元數(shù)據(jù)段為可以包含一個(gè)或更多個(gè)元數(shù)據(jù)有效載荷的數(shù) 據(jù)結(jié)構(gòu)(在本文中有時(shí)稱(chēng)為容器)。每個(gè)有效載荷包括報(bào)頭以提供存在于有效載荷中的元數(shù) 據(jù)的類(lèi)型的明確的指示,其中報(bào)頭包括具體的有效載荷標(biāo)識(shí)符(或有效載荷配置數(shù)據(jù))。有 效載荷在容器內(nèi)的順序未被定義,使得有效載荷可以以任何順序存儲(chǔ)并且分析器必須能夠 對(duì)整個(gè)容器進(jìn)行分析以提取相關(guān)的有效載荷而忽略不相關(guān)的或不支持的有效載荷。圖8(下 面將要描述的)說(shuō)明這樣的容器和容器內(nèi)的有效載荷的結(jié)構(gòu)。
[0056] 當(dāng)兩個(gè)或更多個(gè)音頻處理單元需要貫穿該處理鏈(或內(nèi)容生命周期)彼此合作工 作時(shí),音頻數(shù)據(jù)處理鏈中的通信元數(shù)據(jù)(例如,SSM和/或PIM和/或LPSM)尤其有用。在 音頻比特流中不包括元數(shù)據(jù)的情況下,例如,當(dāng)在鏈中利用兩個(gè)或更多個(gè)音頻編解碼器并 且在媒體消耗裝置的比特流路徑(或比特流的音頻內(nèi)容的渲染點(diǎn))期間多于一次地應(yīng)用單 端音量時(shí),可以出現(xiàn)若干媒體處理問(wèn)題,例如質(zhì)量、電平和空間退化。
[0057] 根據(jù)本發(fā)明的一些實(shí)施方式,嵌入在音頻比特流中的響度處理狀態(tài)元數(shù)據(jù)(LPSM) 可以被認(rèn)證和驗(yàn)證,例如以使得響度調(diào)整實(shí)體能夠證明特定節(jié)目的響度是否已經(jīng)在指定的 范圍內(nèi)以及相應(yīng)的音頻數(shù)據(jù)本身是否未被修改(由此確保符合可適用的調(diào)節(jié))。包括在包 括響度處理狀態(tài)元數(shù)據(jù)的數(shù)據(jù)塊中的響度值可以被讀出以對(duì)此進(jìn)行驗(yàn)證,而不再次計(jì)算響 度。響應(yīng)于LPSM,管理結(jié)構(gòu)可以確定相應(yīng)的音頻內(nèi)容符合(如由LPSM指示的)響度法定的 和/或管理的要求(例如,在商業(yè)廣告響度緩解法下公布的規(guī)則,也稱(chēng)為"CALM"法)而不需 要計(jì)算音頻內(nèi)容的響度。
[0058] 圖1為示例性音頻處理鏈(音頻數(shù)據(jù)處理系統(tǒng))的框圖,在音頻處理鏈中,系統(tǒng)的 元件中的一個(gè)或更多個(gè)可以根據(jù)本發(fā)明的實(shí)施方式被配置。系統(tǒng)包括如所示耦接在一起的 以下元件:預(yù)處理單元、編碼器、信號(hào)分析和元數(shù)據(jù)校正單元、代碼轉(zhuǎn)換器、解碼器和后處理 單元。在所示的系統(tǒng)的變型中,省略元件中的一個(gè)或更多個(gè),或包括額外的音頻數(shù)據(jù)處理單 J Li 〇
[0059] 在一些實(shí)現(xiàn)中,圖1的預(yù)處理單元被配置成接收包括音頻內(nèi)容的PCM (時(shí)域)樣本 作為輸入,并且輸出經(jīng)處理PCM樣本。編碼器可以被配置成接收PCM樣本作為輸入,并且輸 出指示音頻內(nèi)容的編碼的(例如,壓縮的)音頻比特流。指示音頻內(nèi)容的比特流的數(shù)據(jù)在本 文中有時(shí)被稱(chēng)為"音頻數(shù)據(jù)"。如果編碼器根據(jù)本發(fā)明的典型實(shí)施方式被配置,那么從編碼 器輸出的音頻比特流包括P頂和/或SSM (可選地還包括響度處理狀態(tài)元數(shù)據(jù)和/或其他 元數(shù)據(jù))以及音頻數(shù)據(jù)。
[0060] 圖1的信號(hào)分析和元數(shù)據(jù)校正單元可以接收一個(gè)或更多個(gè)編碼音頻比特流作為 輸入,并且通過(guò)執(zhí)行信號(hào)分析(例如,使用編碼音頻比特流中的節(jié)目邊界元數(shù)據(jù))來(lái)確定(例 如,驗(yàn)證)每個(gè)編碼音頻比特流中的元數(shù)據(jù)(例如,處理狀態(tài)元數(shù)據(jù))是否正確。如果信號(hào)分 析和元數(shù)據(jù)校正單元發(fā)現(xiàn)所包括的元數(shù)據(jù)是無(wú)效的,那么通常使用從信號(hào)分析中獲得的正 確值替代錯(cuò)誤值。從而,從信號(hào)分析和元數(shù)據(jù)校正單元輸出的每個(gè)編碼音頻比特流可以包 括校正的(或未校正的)處理狀態(tài)元數(shù)據(jù)以及編碼音頻數(shù)據(jù)。
[0061] 圖1的代碼轉(zhuǎn)換器可以接收編碼音頻比特流作為輸入,并且作為響應(yīng)(例如,通過(guò) 對(duì)輸入流進(jìn)行解碼并且以不同的編碼格式對(duì)解碼流進(jìn)行重新編碼)輸出修改的(例如,不同 編碼的)音頻比特流。如果代碼轉(zhuǎn)換器根據(jù)本發(fā)明的典型的實(shí)施方式被配置,那么從代碼轉(zhuǎn) 換器輸出的音頻比特流包括SSM和/或PM (通常還包括其他元數(shù)據(jù))以及編碼音頻數(shù)據(jù)。 元數(shù)據(jù)可以已經(jīng)被包括在輸入比特流中。
[0062] 圖1的解碼器可以接收編碼的(例如,壓縮的)音頻比特流作為輸入,并且輸出(作 為響應(yīng))解碼PCM音頻樣本流。如果解碼器根據(jù)本發(fā)明的典型的實(shí)施方式被配置,那么在典 型的操作中,解碼器的輸出是或包括下列中的任一個(gè):
[0063] 音頻樣本流,以及從輸入的編碼比特流中提取的SSM和/或PM(通常還有其他元 數(shù)據(jù))的至少一個(gè)相應(yīng)的流;或
[0064] 音頻樣本流,以及根據(jù)從輸入編碼比特流中提取的SSM和/或PM(通常還有其他 元數(shù)據(jù),例如LPSM)所確定的控制位的相應(yīng)的流;或
[0065] 音頻樣本流,但沒(méi)有元數(shù)據(jù)或根據(jù)元數(shù)據(jù)確定的控制位的相應(yīng)的流。在最后一種 情下,解碼器可以從輸入編碼比特流中提取元數(shù)據(jù),并且對(duì)所提取的元數(shù)據(jù)執(zhí)行至少一種 操作(例如,驗(yàn)證),即使沒(méi)有輸出所提取的元數(shù)據(jù)或根據(jù)元數(shù)據(jù)確定的控制位。
[0066] 通過(guò)根據(jù)本發(fā)明的典型的實(shí)施方式配置圖1的后處理單元,后處理單元被配置成 接收解碼的PCM音頻樣本流,并且使用與樣本一起接收的SSM和/或PM(通常還有其他元 數(shù)據(jù),例如LPSM),或根據(jù)與樣本一起接收的元數(shù)據(jù)確定的控制位對(duì)其執(zhí)行后處理(例如,音 頻內(nèi)容的音量校平)。后處理單元還通常被配置成對(duì)經(jīng)后處理音頻內(nèi)容進(jìn)行渲染用于由一 個(gè)或更多個(gè)揚(yáng)聲器回放。
[0067] 本發(fā)明的典型的實(shí)施方式提供增強(qiáng)的音頻處理鏈,其中音頻處理單元(例如,編碼 器、解碼器、代碼轉(zhuǎn)換器以及預(yù)處理單元和后處理單元)根據(jù)由通過(guò)音頻處理單元分別接收 的元數(shù)據(jù)所指示的媒體數(shù)據(jù)的同時(shí)期的狀態(tài)來(lái)修改待應(yīng)用于音頻數(shù)據(jù)的其相應(yīng)的處理。
[0068] 輸入到圖1系統(tǒng)的任何音頻處理單元(例如,圖1的編碼器或代碼轉(zhuǎn)換器)的音頻 數(shù)據(jù)可以包括SSM和/或PM (可選地還包括其他元數(shù)據(jù))以及音頻數(shù)據(jù)(例如,編碼音頻 數(shù)據(jù))。該元數(shù)據(jù)可以根據(jù)本發(fā)明的實(shí)施方式已經(jīng)通過(guò)圖1系統(tǒng)的另一元件(或另一源,在 圖1中未示出)而被包括在輸入音頻中。接收輸入音頻(具有元數(shù)據(jù))的處理單元可以被配 置成對(duì)元數(shù)據(jù)執(zhí)行至少一種操作(例如,驗(yàn)證),或響應(yīng)于元數(shù)據(jù)(例如,輸入音頻的自適應(yīng) 處理),并且還通常將元數(shù)據(jù)、元數(shù)據(jù)的經(jīng)處理的版本、或根據(jù)元數(shù)據(jù)確定的控制位包括在 其輸出音頻中。
[0069] 本發(fā)明的音頻處理單元(或音頻處理器)的典型的實(shí)施方式被配置成基于由對(duì)應(yīng) 于音頻數(shù)據(jù)的元數(shù)據(jù)所指示的音頻數(shù)據(jù)的狀態(tài)來(lái)執(zhí)行音頻數(shù)據(jù)的自適應(yīng)處理。在一些實(shí)施 方式中,自適應(yīng)處理是(或包括)響度處理(如果元數(shù)據(jù)指示還未對(duì)音頻數(shù)據(jù)執(zhí)行響度處理 或與響度處理類(lèi)似的處理),而不是(且不包括)響度處理(如果元數(shù)據(jù)指示已經(jīng)對(duì)音頻數(shù)據(jù) 執(zhí)行了這樣的響度處理或與響度處理類(lèi)似的處理)。在一些實(shí)施方式中,自適應(yīng)處理是或包 括(例如,在元數(shù)據(jù)驗(yàn)證子單元中執(zhí)行的)元數(shù)據(jù)驗(yàn)證以確保音頻處理單元基于由元數(shù)據(jù)所 指示的音頻數(shù)據(jù)的狀態(tài)來(lái)執(zhí)行音頻數(shù)據(jù)的其他自適應(yīng)處理。在一些實(shí)施方式中,該驗(yàn)證確 定與音頻數(shù)據(jù)相關(guān)聯(lián)(例如,包括在具有音頻數(shù)據(jù)的比特流中)的元數(shù)據(jù)的可靠性。例如, 如果驗(yàn)證元數(shù)據(jù)是可靠的,那么來(lái)自一種先前執(zhí)行的音頻處理的結(jié)果可以被重新使用并且 可以避免新執(zhí)行相同類(lèi)型的音頻處理。另一方面,如果發(fā)現(xiàn)元數(shù)據(jù)已經(jīng)被篡改(或以其他 方式不可靠),那么據(jù)稱(chēng)先前執(zhí)行的一種類(lèi)型的媒體處理(如由不可靠的元數(shù)據(jù)指示的)可 以由音頻處理單元重復(fù),和/或可以由音頻處理單元對(duì)元數(shù)據(jù)和/或音頻數(shù)據(jù)執(zhí)行其他處 理。如果該單元確定元數(shù)據(jù)是有效的(例如,基于所提取的加密值與參考加密值的匹配),音 頻處理單元還可以被配置成用信號(hào)向增強(qiáng)的媒體處理鏈下游的其他音頻處理單元通知元 數(shù)據(jù)(例如,存在于媒體比特流中)是有效的。
[0070] 圖2是作為本發(fā)明的音頻處理單元的實(shí)施方式的編碼器(100)的框圖。編碼器100 的任何部件或元件可以以硬件或軟件或硬件與軟件的組合被實(shí)現(xiàn)為一個(gè)或更多個(gè)處理和/ 或一個(gè)或更多個(gè)電路(例如,ASIC、FPGA或其他集成電路)。編碼器100包括如所示地連接 的幀緩沖器110、分析器111、解碼器101、音頻狀態(tài)驗(yàn)證器102、響度處理級(jí)103、音頻流選擇 級(jí)104、編碼器105、填充器/格式器級(jí)107、元數(shù)據(jù)生成級(jí)106、對(duì)白響度測(cè)量子系統(tǒng)108以 及幀緩沖器109。編碼器100通常還包括其他處理元件(未示出)。
[0071] 編碼器100 (為代碼轉(zhuǎn)換器)被配置成包括通過(guò)使用包括在輸入比特流中的響度 處理狀態(tài)元數(shù)據(jù)執(zhí)行自適應(yīng)和自動(dòng)的響度處理來(lái)將輸入音頻比特流(例如,可以是AC-3比 特流、E-AC-3比特流或杜比E比特流中的一個(gè))轉(zhuǎn)換成編碼輸出音頻比特流(例如,可以是 AC-3比特流、E-AC-3比特流或杜比E比特流中的另一個(gè))。例如,編碼器100可以被配置成 將(通常用在生產(chǎn)和廣播設(shè)備中,但不用在接收已經(jīng)被廣播的音頻節(jié)目的消費(fèi)者設(shè)備中的 格式的)輸入杜比E比特流轉(zhuǎn)換成AC-3或E-AC-3格式的(適合于廣播至消費(fèi)者設(shè)備的)編 碼輸出音頻比特流。
[0072] 圖2的系統(tǒng)還包括編碼音頻傳送子系統(tǒng)150 (其存儲(chǔ)和/或傳送從編碼器100輸 出的編碼比特流)和解碼器152。從編碼器100輸出的編碼音頻比特流可以由子系統(tǒng)150 (例如,以DVD或藍(lán)光光盤(pán)格式)存儲(chǔ),或由子系統(tǒng)150 (可以實(shí)現(xiàn)傳輸線(xiàn)路或網(wǎng)絡(luò))傳輸,或 可以由子系統(tǒng)150存儲(chǔ)和傳輸。解碼器152被配置成包括通過(guò)從比特流的每個(gè)幀中提取元 數(shù)據(jù)(PIM和/或SSM、以及可選地還有響度處理狀態(tài)元數(shù)據(jù)和/或其他元數(shù)據(jù))(以及可選 地還從比特流中提取節(jié)目邊界元數(shù)據(jù))以及生成解碼音頻數(shù)據(jù),對(duì)經(jīng)由子系統(tǒng)150接收的 (由編碼器100生成的)編碼音頻比特流進(jìn)行解碼。通常,解碼器152被配置成使用PM和 /或SSM和/或LPSM (可選地還使用節(jié)目邊界元數(shù)據(jù))對(duì)解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理,和 /或?qū)⒔獯a音頻數(shù)據(jù)和元數(shù)據(jù)轉(zhuǎn)發(fā)至被配置成使用元數(shù)據(jù)對(duì)解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理 的后處理器。通常,解碼器152包括存儲(chǔ)(例如,以非暫態(tài)方式)從子系統(tǒng)150中接收的編碼 音頻比特流的緩沖器。
[0073] 編碼器100和解碼器152的各種實(shí)現(xiàn)被配置成執(zhí)行本發(fā)明的方法的不同的實(shí)施方 式。
[0074] 幀緩沖器110是耦接以接收編碼輸入音頻比特流的緩沖存儲(chǔ)器。在操作中,緩沖 器110存儲(chǔ)(例如,以非暫態(tài)方式)編碼音頻比特流的至少一個(gè)幀,并且編碼音頻比特流的幀 的序列被從緩沖器110設(shè)定到分析器111。
[0075] 將分析器111耦接并配置成從包括這樣的元數(shù)據(jù)的編碼輸入音頻的每個(gè)幀中提 取PM和/或SSM、以及響度處理狀態(tài)元數(shù)據(jù)(LPSM)、以及可選地還有節(jié)目邊界元數(shù)據(jù)(和 /或其他元數(shù)據(jù)),至少將LPSM (以及可選地還有節(jié)目邊界元數(shù)據(jù)和/或其他元數(shù)據(jù))設(shè)定 到音頻狀態(tài)驗(yàn)證器102、響度處理級(jí)103、級(jí)106和子系統(tǒng)108,以從編碼輸入音頻中提取音 頻數(shù)據(jù)并且將音頻數(shù)據(jù)設(shè)定到解碼器101。編碼器100的解碼器101被配置成對(duì)音頻數(shù)據(jù) 進(jìn)行解碼以生成解碼音頻數(shù)據(jù),并且將解碼音頻數(shù)據(jù)設(shè)定到響度處理級(jí)103、音頻流選擇級(jí) 104、子系統(tǒng)108以及通常還設(shè)定到狀態(tài)驗(yàn)證器102。
[0076] 狀態(tài)驗(yàn)證器102被配置成對(duì)設(shè)定到其的LPSM (可選地其他元數(shù)據(jù))進(jìn)行認(rèn)證和 驗(yàn)證。在一些實(shí)施方式中,LPSM是(或包括在)數(shù)據(jù)塊(中),數(shù)據(jù)塊已經(jīng)包括在輸入比特 流中(例如,根據(jù)本發(fā)明的實(shí)施方式)。塊可以包括加密散列(基于散列的消息認(rèn)證代碼或 "HMAC")用于對(duì)LPSM (可選地還有其他元數(shù)據(jù))和/或(從解碼器101提供至驗(yàn)證器102的) 基本的音頻數(shù)據(jù)進(jìn)行處理。在這些實(shí)施方式中,數(shù)據(jù)塊可以被數(shù)字地標(biāo)記,使得下游的音頻 處理單元可以相對(duì)容易地認(rèn)證和驗(yàn)證處理狀態(tài)元數(shù)據(jù)。
[0077] 例如,HMAC用于生成摘要,并且包括在本發(fā)明的比特流中的保護(hù)值可以包括該摘 要。該摘要可以關(guān)于A(yíng)C-3幀被如下生成 :
[0078] 1.在A(yíng)C-3數(shù)據(jù)和LPSM被編碼之后,幀數(shù)據(jù)字節(jié)(連接的幀數(shù)據(jù)#1和幀數(shù)據(jù)#2) 和LPSM數(shù)據(jù)字節(jié)用作哈希函數(shù)HMAC的輸入。沒(méi)有考慮可以存在于輔助數(shù)據(jù)字段內(nèi)的其他 數(shù)據(jù)用于計(jì)算摘要。這樣的其他數(shù)據(jù)可以是既不屬于A(yíng)C-3數(shù)據(jù)也不屬于LPSM數(shù)據(jù)的字節(jié)。 可以不考慮包括在LPSM中的保護(hù)位用于計(jì)算HMAC摘要。
[0079] 2.在計(jì)算摘要之后,被寫(xiě)入比特流中的為保護(hù)位保留的字段中。
[0080] 3.生成完整的AC-3幀的最后步驟是CRC校驗(yàn)的計(jì)算。這被寫(xiě)在幀的結(jié)束處并且 考慮屬于該幀的所有的數(shù)據(jù),包括LPSM位。
[0081] 包括但不限于一個(gè)或更多個(gè)非HMAC加密方法中的任意一個(gè)的其他加密方法可以 用于LPSM和/或其他元數(shù)據(jù)(例如,在驗(yàn)證器102中)的驗(yàn)證,以確保元數(shù)據(jù)和/或基本音 頻數(shù)據(jù)的安全的傳輸和接收。例如,可以在接收本發(fā)明的音頻比特流的實(shí)施方式的每個(gè)音 頻處理單元中執(zhí)行驗(yàn)證(使用這樣的加密方法),以確定包括在該比特流中的元數(shù)據(jù)和相應(yīng) 的音頻數(shù)據(jù)是否已經(jīng)經(jīng)歷(和/或已經(jīng)產(chǎn)生)具體的處理(由元數(shù)據(jù)指示的)并且在這樣的 具體的處理執(zhí)行之后是否未被修改。
[0082] 狀態(tài)驗(yàn)證器102將控制數(shù)據(jù)設(shè)定到音頻流選擇級(jí)104、元數(shù)據(jù)生成器106以及對(duì)白 響度測(cè)量子系統(tǒng)108,以表示驗(yàn)證操作的結(jié)果。響應(yīng)于控制數(shù)據(jù),級(jí)104可以選擇(以及傳遞 至編碼器105) :
[0083] 響度處理級(jí)103的經(jīng)自適應(yīng)處理的輸出(例如,當(dāng)LPSM指示從解碼器101輸出的 音頻數(shù)據(jù)沒(méi)有經(jīng)歷特定類(lèi)型的響度處理,以及來(lái)自驗(yàn)證器102的控制位指示LPSM有效時(shí)); 或
[0084] 從解碼器102輸出的音頻數(shù)據(jù)(例如,當(dāng)LPSM指示從解碼器101輸出的音頻數(shù)據(jù) 已經(jīng)經(jīng)歷將由級(jí)103執(zhí)行的特定類(lèi)型的響度處理,并且來(lái)自驗(yàn)證器102的控制位指示LPSM 有效時(shí))。
[0085] 編碼器100的級(jí)103被配置成基于由通過(guò)解碼器101所提取的LPSM指示的一個(gè) 或更多個(gè)音頻數(shù)據(jù)特性,對(duì)從解碼器101輸出的解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)響度處理。級(jí)103 可以是自適應(yīng)變換域?qū)崟r(shí)響度和動(dòng)態(tài)范圍控制處理器。級(jí)103可以接收用戶(hù)輸入(例如,用 戶(hù)目標(biāo)響度/動(dòng)態(tài)范圍值或?qū)Π讱w一化值)、或其他元數(shù)據(jù)輸入(例如,一種或更多種類(lèi)型的 第三方數(shù)據(jù)、跟蹤信息、標(biāo)識(shí)符、所有權(quán)或標(biāo)準(zhǔn)信息、用戶(hù)注釋數(shù)據(jù)、用戶(hù)偏好數(shù)據(jù)等)和/或 其他輸入(例如,來(lái)自指紋識(shí)別處理),并且使用這樣的輸入以對(duì)從解碼器101輸出的解碼音 頻數(shù)據(jù)進(jìn)行處理。級(jí)103可以對(duì)指示(由通過(guò)分析器111提取的節(jié)目邊界元數(shù)據(jù)所表示的) 單個(gè)音頻節(jié)目的(從解碼器101輸出的)解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)響度處理,并且可以響應(yīng) 于接收到指示由通過(guò)分析器111提取的節(jié)目邊界元數(shù)據(jù)所指示的不同的音頻節(jié)目的(從解 碼器101輸出的)解碼音頻數(shù)據(jù)將響度處理復(fù)位。
[0086] 當(dāng)來(lái)自驗(yàn)證器102的控制位指示LPSM無(wú)效時(shí),對(duì)白響度測(cè)量子系統(tǒng)108可以操作 以使用由解碼器101提取的LPSM (和/或其他元數(shù)據(jù))來(lái)確定表示對(duì)白(或其他語(yǔ)音)的(來(lái) 自解碼器101的)解碼音頻的段的響度。當(dāng)來(lái)自驗(yàn)證器102的控制位指示LPSM有效時(shí),當(dāng) LPSM指示(來(lái)自解碼器101的)解碼音頻的對(duì)白(或其他語(yǔ)音)段的先前確定的響度時(shí),可以 禁止對(duì)白響度測(cè)量子系統(tǒng)108的操作。子系統(tǒng)108可以對(duì)表示(通過(guò)分析器111所提取的 節(jié)目邊界元數(shù)據(jù)所指示的)單個(gè)音頻節(jié)目的解碼音頻數(shù)據(jù)執(zhí)行響度測(cè)量,并且可以響應(yīng)于 接收到表示由這樣的節(jié)目邊界元數(shù)據(jù)所指示的不同的音頻節(jié)目的解碼音頻數(shù)據(jù)將響度處 理復(fù)位。
[0087] 存在有用的工具(例如,杜比LM100響度計(jì))用于方便地和容易地對(duì)音頻內(nèi)容中的 對(duì)白的電平進(jìn)行測(cè)量。本發(fā)明的APU (例如,編碼器100的級(jí)108)的一些實(shí)施方式被實(shí)現(xiàn) 以包括這樣的工具(或執(zhí)行這樣的工具的功能)來(lái)對(duì)音頻比特流(例如,從編碼器100的解碼 器101設(shè)定到級(jí)108的解碼AC-3比特流)的音頻內(nèi)容的平均對(duì)白響度進(jìn)行測(cè)量。
[0088] 如果級(jí)108被實(shí)現(xiàn)成對(duì)音頻數(shù)據(jù)的真實(shí)平均對(duì)白響度進(jìn)行測(cè)量,那么測(cè)量可以包 括將主要包含語(yǔ)音的音頻內(nèi)容的段分離的步驟。然后,根據(jù)響度測(cè)量算法來(lái)處理主要為語(yǔ) 音的音頻段。對(duì)于根據(jù)AC-3比特流解碼的音頻數(shù)據(jù),該算法可以是標(biāo)準(zhǔn)的K加權(quán)響度測(cè)量 (根據(jù)國(guó)際標(biāo)準(zhǔn)ITU-R BS1770)??商娲?,可以使用其他響度測(cè)量(例如,基于響度的心理 聲學(xué)模型的那些測(cè)量)。
[0089] 語(yǔ)音段的分離不是測(cè)量音頻數(shù)據(jù)的平均對(duì)白響度所必需的。然而,它提高測(cè)量的 準(zhǔn)確度,并且通常提供來(lái)自聽(tīng)者感知的較滿(mǎn)意的結(jié)果。因?yàn)椴皇撬械囊纛l內(nèi)容包含對(duì) 白(語(yǔ)音),整個(gè)音頻內(nèi)容的響度測(cè)量可以提供語(yǔ)音已經(jīng)存在的音頻的對(duì)白電平的足夠的近 似。
[0090] 元數(shù)據(jù)生成器106生成(和/或傳遞至級(jí)107)要由級(jí)107包括在待從編碼器100 輸出的編碼比特流中。元數(shù)據(jù)生成器106可以將由編碼器101和/或分析器111提取的 LPSM (可選地還有UM和/或PM和/或節(jié)目邊界元數(shù)據(jù)和/或其他元數(shù)據(jù))傳遞至級(jí)107 (例如,當(dāng)來(lái)自驗(yàn)證器102的控制位指示LPSM和/或其他元數(shù)據(jù)有效時(shí)),或生成新的UM和 /或PIM和/或LPSM和/或節(jié)目邊界元數(shù)據(jù)和/或其他元數(shù)據(jù)并且將新的元數(shù)據(jù)設(shè)定到級(jí) 107 (例如,當(dāng)來(lái)自驗(yàn)證器102的控制位指示由解碼器101提取的元數(shù)據(jù)無(wú)效時(shí)),或可以將 由解碼器101和/或分析器111提取的元數(shù)據(jù)與新生成的元數(shù)據(jù)的組合設(shè)定到級(jí)107。元 數(shù)據(jù)生成器106可以將由子系統(tǒng)108生成的響度數(shù)據(jù)以及指示由子系統(tǒng)108執(zhí)行的響度處 理的類(lèi)型的至少一個(gè)值包括在LPSM中,將LPSM設(shè)定到級(jí)107以用于包括在待從編碼器100 輸出的編碼比特流中。
[0091] 元數(shù)據(jù)生成器106可以生成用于待被包括在編碼比特流和/或待被包括在編碼比 特流中的基本音頻數(shù)據(jù)中的LPSM (可選地還有其他元數(shù)據(jù))的解密、認(rèn)證或驗(yàn)證中的至少 一個(gè)的控制位(可以由基于散列的消息認(rèn)證代碼或"HMAC"組成或包括基于散列的消息認(rèn)證 代碼或"HMAC")。元數(shù)據(jù)生成器106可以向級(jí)107提供這樣的保護(hù)位以用于包括在編碼比 特流中。
[0092] 在典型的操作中,對(duì)白響度測(cè)量子系統(tǒng)108對(duì)從解碼器101輸出的音頻數(shù)據(jù)進(jìn)行 處理以響應(yīng)于音頻數(shù)據(jù)生成響度值(例如,選通的和未選通的對(duì)白響度值)和動(dòng)態(tài)范圍值。 響應(yīng)于這些值,元數(shù)據(jù)生成器106可以生成響度處理狀態(tài)元數(shù)據(jù)(LPSM)以用于(由填充器/ 格式器107)包括在待從編碼器100輸出的編碼比特流中。
[0093] 另外,可選地,或可替代地,編碼器100的子系統(tǒng)106和/或108可以執(zhí)行音頻數(shù)據(jù) 的額外的分析以生成指示音頻數(shù)據(jù)的至少一個(gè)特性的元數(shù)據(jù)以用于包括在待從級(jí)107輸 出的編碼比特流中。
[0094] 編碼器105對(duì)從選擇級(jí)104輸出的音頻數(shù)據(jù)進(jìn)行編碼(例如,通過(guò)對(duì)其執(zhí)行壓縮), 并且將編碼的音頻設(shè)定到級(jí)107以用于包括在待從級(jí)107輸出的編碼比特流中。
[0095] 級(jí)107將來(lái)自編碼器105的編碼音頻和來(lái)自生成器106的元數(shù)據(jù)(包括PM和/ 或SSM)進(jìn)行復(fù)用以生成待從級(jí)107中輸出的編碼比特流,優(yōu)選地使得編碼比特流具有由本 發(fā)明的優(yōu)選實(shí)施方式指定的格式。
[0096] 幀緩沖器109為存儲(chǔ)(例如,以非暫態(tài)方式)從級(jí)107輸出的編碼音頻比特流的至 少一個(gè)幀的緩沖存儲(chǔ)器,然后編碼音頻比特流的一系列幀被從緩沖器109作為來(lái)自編碼器 100的輸出設(shè)定至傳送系統(tǒng)150。
[0097] 由元數(shù)據(jù)生成器106生成并且由級(jí)107包括在編碼比特流中的LPSM通常指示相 應(yīng)音頻數(shù)據(jù)的響度處理狀態(tài)(例如,已經(jīng)對(duì)音頻數(shù)據(jù)執(zhí)行什么類(lèi)型的響度處理)以及相應(yīng)音 頻數(shù)據(jù)的響度(例如,測(cè)量的對(duì)白響度、選通和/或未選通的響度、和/或動(dòng)態(tài)范圍)。
[0098] 在本文中,對(duì)音頻數(shù)據(jù)執(zhí)行的響度和/或電平測(cè)量的"選通"是指超過(guò)閾值的計(jì)算 值被包括在最終測(cè)量(例如,在最終測(cè)量的值中忽略低于_60dBFS的短期響度值)中的特定 電平或響度閾值。絕對(duì)值的選通是指固定的電平或響度,而相對(duì)值的選通是指依賴(lài)于當(dāng)前 "未選通的"測(cè)量值的值。
[0099] 在編碼器100的一些實(shí)現(xiàn)中,緩存在存儲(chǔ)器109 (以及輸出至傳送系統(tǒng)150)的編 碼比特流為AC-3比特流或E-AC-3比特流,并且包括音頻數(shù)據(jù)段(例如,圖4中所示的幀的 ABO至AB5段)和元數(shù)據(jù)段,其中音頻數(shù)據(jù)段指示音頻數(shù)據(jù),并且元數(shù)據(jù)段中的至少一些中 的每個(gè)包括PIM和/或SSM (以及可選地其他元數(shù)據(jù))。級(jí)107將元數(shù)據(jù)段(包括元數(shù)據(jù)) 插入到下面的格式的比特流中。包括PIM和/或SSM的元數(shù)據(jù)段中的每個(gè)元數(shù)據(jù)段被包括 在比特流的無(wú)用位段(例如,圖4或圖7中所示的無(wú)用位段"W")中,或比特流的幀的比特流 信息("BSI")段的"addbsi"字段中,或比特流的幀的結(jié)束處的輔助數(shù)據(jù)字段(例如,圖4或 圖7中所示的AUX段)。比特流的幀可以包括一個(gè)或兩個(gè)元數(shù)據(jù)段,每個(gè)元數(shù)據(jù)段包括元數(shù) 據(jù),并且如果幀包括兩個(gè)元數(shù)據(jù)段,一個(gè)可以存在于幀的addbsi字段中而另一個(gè)存在于幀 的AUX字段中。
[0100] 在一些實(shí)施方式中,由級(jí)107插入的每個(gè)元數(shù)據(jù)段(在本文中有時(shí)稱(chēng)為"容器")具 有包括元數(shù)據(jù)段報(bào)頭(可選地還包括其他強(qiáng)制的或"核心"元素)以及在元數(shù)據(jù)段報(bào)頭之后 的一個(gè)或更多個(gè)元數(shù)據(jù)有效載荷的格式。如果存在,SIM被包括在元數(shù)據(jù)有效載荷中的一個(gè) 有效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有第一類(lèi)型的格式)中。如果存在,PM被包括 在元數(shù)據(jù)有效載荷中的另一個(gè)有效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有第二類(lèi)型的 格式)中。類(lèi)似地,元數(shù)據(jù)的每個(gè)其他類(lèi)型(如果存在)被包括在元數(shù)據(jù)有效載荷中的另一有 效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有針對(duì)元數(shù)據(jù)的類(lèi)型的格式)中。示例性格式使 得能夠在除了解碼期間之外的時(shí)間便于訪(fǎng)問(wèn)(例如,由解碼之后的后處理器、或由被配置成 在沒(méi)有對(duì)編碼比特流執(zhí)行完全解碼的情況下識(shí)別元數(shù)據(jù)的處理器)SSM、PIM和其他元數(shù)據(jù), 并且允許在比特流的解碼期間(例如,子流識(shí)別的)方便和高效的誤差檢測(cè)和校正。例如,在 不以示例性格式訪(fǎng)問(wèn)SSM的情況下,解碼器可能錯(cuò)誤地識(shí)別與節(jié)目相關(guān)聯(lián)的子流的正確數(shù) 量。元數(shù)據(jù)段中的一個(gè)元數(shù)據(jù)有效載荷可以包括SSM,元數(shù)據(jù)段中的另一個(gè)元數(shù)據(jù)有效載荷 可以包括PIM,以及可選地,元數(shù)據(jù)段中的至少一個(gè)其他元數(shù)據(jù)有效載荷可以包括其他元數(shù) 據(jù)(例如,響度處理狀態(tài)元數(shù)據(jù)或"LPSM")。
[0101] 在一些實(shí)施方式中,(由級(jí)107)包括在編碼比特流(例如,指示至少一個(gè)音頻節(jié)目 的E-AC-3比特流)的幀中的子流結(jié)構(gòu)元數(shù)據(jù)(SSM)有效載荷包括下面的格式的SSM :
[0102] 有效載荷報(bào)頭,通常包括至少一個(gè)識(shí)別值(例如,指示SSM格式版本的2位值,以及 可選地長(zhǎng)度、周期、計(jì)數(shù)和子流相關(guān)聯(lián)值);以及在報(bào)頭之后:
[0103] 指示由比特流指示的節(jié)目的獨(dú)立子流的數(shù)量的獨(dú)立子流元數(shù)據(jù);以及
[0104] 從屬子流元數(shù)據(jù),其指示:節(jié)目的每個(gè)獨(dú)立子流是否具有至少一個(gè)相關(guān)聯(lián)的從屬 子流(即,至少一個(gè)從屬子流是否與所述每個(gè)獨(dú)立子流相關(guān)聯(lián)),以及如果是這樣,與節(jié)目的 每個(gè)獨(dú)立子流相關(guān)聯(lián)的從屬子流的數(shù)量。
[0105] 預(yù)期的是,編碼比特流的獨(dú)立子流可以指示音頻節(jié)目的揚(yáng)聲器通道集(例如,5. 1 揚(yáng)聲器通道音頻節(jié)目的揚(yáng)聲器通道),以及一個(gè)或更多個(gè)從屬子流中的每個(gè)(與獨(dú)立子流相 關(guān)聯(lián),由從屬子流元數(shù)據(jù)指示)可以指示節(jié)目的目標(biāo)通道。然而,編碼比特流的獨(dú)立比特流 通常指示節(jié)目的揚(yáng)聲器通道集,并且與獨(dú)立子流相關(guān)聯(lián)的每個(gè)從屬子流(由從屬子流元數(shù) 據(jù)指示)指示節(jié)目的至少一個(gè)額外的揚(yáng)聲器通道。
[0106] 在一些實(shí)施方式中,(由級(jí)107)包括在編碼比特流(例如,指示至少一個(gè)音頻節(jié)目 的E-AC-3比特流)的幀中的節(jié)目信息元數(shù)據(jù)(PM)有效載荷具有下面的格式:
[0107] 有效載荷報(bào)頭,通常包括至少一個(gè)標(biāo)識(shí)值(例如,指示PM格式版本的值,以及可 選地長(zhǎng)度、周期、計(jì)數(shù)和子流相關(guān)聯(lián)值);以及在報(bào)頭之后的下面格式的PIM :
[0108] 指示音頻節(jié)目的每個(gè)靜音通道和每個(gè)非靜音通道(即,節(jié)目的哪些通道包含音頻 信息,而哪些通道(如果有)僅包含靜音(通常關(guān)于幀的持續(xù)時(shí)間))的活動(dòng)通道元數(shù)據(jù)。在 編碼比特流是AC-3或E-AC-3比特流的實(shí)施方式中,比特流的幀中的活動(dòng)通道元數(shù)據(jù)可以 結(jié)合比特流的額外的元數(shù)據(jù)(例如,幀的音頻編碼模式("acmod")字段,以及,如果存在,幀 或相關(guān)聯(lián)的從屬子流幀中的chanmap字段)以確定節(jié)目的哪些通道包含音頻信息而哪些通 道包含靜音。AC-3或E-AC-3幀的"acmod"字段指示由幀的音頻內(nèi)容指示的音頻節(jié)目的全 音域通道的數(shù)量(例如,節(jié)目是I. 0通道單通道節(jié)目、2. 0通道立體聲節(jié)目、還是包括L、R、C、 Ls、Rs全音域通道的節(jié)目),或者幀指示兩個(gè)獨(dú)立的I. 0通道單通道節(jié)目。E-AC-3比特流的 "chanmap"字段指示由比特流指示的從屬子流的通道映射?;顒?dòng)通道元數(shù)據(jù)可以有助于實(shí) 現(xiàn)解碼器的上混合(在后處理器中)下游,例如以在解碼器的輸出處將音頻添加至包含靜音 的通道;
[0109] 指示節(jié)目是否被下混合(在編碼之前或在編碼期間)以及如果節(jié)目被下混合則被 應(yīng)用的下混合的類(lèi)型的下混合處理狀態(tài)元數(shù)據(jù)。下混合處理狀態(tài)元數(shù)據(jù)可以有助于實(shí)現(xiàn)解 碼器的上混合(在后處理器中)下游,例如以使用最匹配被應(yīng)用的下混合的類(lèi)型的參數(shù)對(duì)節(jié) 目的音頻內(nèi)容進(jìn)行上混合。在編碼比特流是AC-3或E-AC-3比特流的實(shí)施方式中,下混合 處理狀態(tài)元數(shù)據(jù)可以結(jié)合幀的音頻編碼模型("acmod")字段以確定應(yīng)用于節(jié)目的通道的下 混合(如果有)的類(lèi)型;
[0110] 指示在編碼之前或在編碼期間節(jié)目是否被上混合(例如,從較小數(shù)量的通道)以及 如果節(jié)目被上混合則所應(yīng)用的上混合的類(lèi)型的上混合處理狀態(tài)元數(shù)據(jù)。上混合處理狀態(tài)元 數(shù)據(jù)可以有助于實(shí)現(xiàn)解碼器的下混合(在后處理器中)下游,例如以與應(yīng)用于節(jié)目的上混合 (例如,杜比定向邏輯、或杜比定向邏輯II電影模式、或杜比定向邏輯II音樂(lè)模式、或杜比專(zhuān) 業(yè)上混合器)的類(lèi)型一致的方式對(duì)節(jié)目的音頻內(nèi)容進(jìn)行下混合。在編碼比特流是E-AC-3比 特流的實(shí)施方式中,上混合處理狀態(tài)元數(shù)據(jù)可以結(jié)合其他元數(shù)據(jù)(例如,幀的"strmtyp"字 段的值)以確定應(yīng)用于節(jié)目的通道的上混合(如果有)的類(lèi)型。(E-AC-3比特流的幀的BSI 字段中的)"strmtyp"字段的值指示幀的音頻內(nèi)容是否屬于獨(dú)立流(其確定節(jié)目)或(包括 多個(gè)子流或與多個(gè)子流相關(guān)聯(lián)的節(jié)目的)獨(dú)立子流,從而可以獨(dú)立于由E-AC-3比特流指示 的任何其他子流被編碼,或幀的音頻內(nèi)容是否屬于(包括多個(gè)子流或與多個(gè)子流相關(guān)聯(lián)的 節(jié)目的)從屬子流,從而必須結(jié)合與其相關(guān)聯(lián)的獨(dú)立子流被解碼;以及
[0111] 預(yù)處理狀態(tài)元數(shù)據(jù),其指示:是否對(duì)幀的音頻內(nèi)容執(zhí)行了預(yù)處理(在生成編碼比特 流的音頻內(nèi)容的編碼之前),以及如果對(duì)幀音頻內(nèi)容執(zhí)行了預(yù)處理則被執(zhí)行的預(yù)處理的類(lèi) 型。
[0112] 在一些實(shí)現(xiàn)中,預(yù)處理狀態(tài)元數(shù)據(jù)指示:
[0113] 是否應(yīng)用環(huán)繞衰減(例如,在編碼之前,音頻節(jié)目的環(huán)繞通道是否被衰減3dB),
[0114] 是否(例如,在編碼之前,對(duì)音頻節(jié)目的環(huán)繞通道Ls和Rs通道)應(yīng)用90°相移,
[0115] 在編碼之前,是否對(duì)音頻節(jié)目的LFE通道應(yīng)用低通濾波器,
[0116] 在生成期間,是否監(jiān)視節(jié)目的LFE通道的電平以及如果監(jiān)視了節(jié)目的LFE通道的 電平則LFE通道的監(jiān)視的電平相對(duì)于節(jié)目的全音域音頻通道的電平,
[0117] 是否應(yīng)當(dāng)對(duì)節(jié)目的解碼音頻內(nèi)容的每個(gè)塊執(zhí)行(例如,在解碼器中)動(dòng)態(tài)范圍壓縮 以及如果應(yīng)當(dāng)對(duì)節(jié)目的解碼音頻內(nèi)容的每個(gè)塊執(zhí)行動(dòng)態(tài)范圍壓縮則待被執(zhí)行的動(dòng)態(tài)范圍 壓縮的類(lèi)型(和/或參數(shù))(例如,該類(lèi)型的預(yù)處理狀態(tài)元數(shù)據(jù)可以指示以下壓縮配置文件 類(lèi)型中的哪個(gè)由編碼器假定以生成被包括在編碼比特流中的動(dòng)態(tài)范圍壓縮控制值:電影標(biāo) 準(zhǔn)、電影光線(xiàn)、音樂(lè)標(biāo)準(zhǔn)、音樂(lè)光線(xiàn)或語(yǔ)音?;蛘撸擃?lèi)型的預(yù)處理狀態(tài)元數(shù)據(jù)可以指示應(yīng)當(dāng) 以由被包括在編碼比特流中的動(dòng)態(tài)范圍壓縮控制值確定的方式對(duì)節(jié)目的解碼音頻內(nèi)容的 每個(gè)幀執(zhí)行重動(dòng)態(tài)范圍壓縮(" compr "壓縮)),
[0118] 是否使用譜擴(kuò)展和/或通道耦合編碼以對(duì)特定頻率范圍的節(jié)目?jī)?nèi)容進(jìn)行編碼,以 及如果使用譜擴(kuò)展和/或通道耦合編碼以對(duì)特定頻率范圍的節(jié)目?jī)?nèi)容進(jìn)行編碼則對(duì)其執(zhí) 行譜擴(kuò)展編碼的內(nèi)容的頻率分量的最小頻率和最大頻率,以及對(duì)其執(zhí)行通道耦合編碼的內(nèi) 容的頻率分量的最小頻率和最大頻率。該類(lèi)型的預(yù)處理狀態(tài)元數(shù)據(jù)信息可以有助于執(zhí)行解 碼器的均衡(在后處理器中)下游。通道耦合信息和譜擴(kuò)展信息兩者都有助于在代碼轉(zhuǎn)換操 作和應(yīng)用期間優(yōu)化質(zhì)量。例如,編碼器可以基于參數(shù)例如譜擴(kuò)展和通道耦合信息的狀態(tài)優(yōu) 化其行為(包括預(yù)處理步驟例如頭戴式耳機(jī)虛擬、上混合等的自適應(yīng))。而且,編碼器可以基 于進(jìn)入的(并且認(rèn)證的)元數(shù)據(jù)的狀態(tài)來(lái)動(dòng)態(tài)地修改其耦合參數(shù)和譜擴(kuò)展參數(shù)以匹配最佳 值和/或?qū)⑵漶詈虾妥V擴(kuò)展參數(shù)修改成最佳值,以及
[0119] 對(duì)白增強(qiáng)調(diào)整范圍數(shù)據(jù)是否包括在編碼比特流中,以及如果對(duì)白增強(qiáng)調(diào)整范圍數(shù) 據(jù)包括在編碼比特流中,則在相對(duì)于音頻節(jié)目中的非對(duì)白內(nèi)容的電平調(diào)整對(duì)白內(nèi)容的電平 的對(duì)白增強(qiáng)處理(例如,在解碼器的后處理器下游)的執(zhí)行期間可得到的調(diào)整的范圍。
[0120] 在一些實(shí)現(xiàn)中,額外的預(yù)處理狀態(tài)元數(shù)據(jù)(例如,指示頭戴式耳機(jī)相關(guān)的參數(shù)的元 數(shù)據(jù))被包括在(由級(jí)107)待從編碼器100輸出的編碼比特流的PIM有效載荷中。
[0121] 在一些實(shí)現(xiàn)中,(由級(jí)107)包括在編碼比特流(例如,指示至少一個(gè)音頻節(jié)目的 E-AC-3比特流)的幀中的LPSM有效載荷包括下面的格式的LPSM :
[0122] 報(bào)頭(通常包括標(biāo)識(shí)LPSM有效載荷的開(kāi)始的同步字,在同步字之后的至少一個(gè)標(biāo) 識(shí)值,例如,在下面的表2中表示的LPSM格式版本、長(zhǎng)度、周期、計(jì)數(shù)和子流關(guān)聯(lián)值);以及
[0123] 在報(bào)頭之后的:
[0124] 指示相應(yīng)音頻數(shù)據(jù)指示對(duì)白或不指示對(duì)白(例如,相應(yīng)音頻數(shù)據(jù)的哪些通道指示 對(duì)白)的至少一個(gè)對(duì)白指示值(例如,表2的參數(shù)"對(duì)白通道");
[0125] 指示相應(yīng)的音頻內(nèi)容是否符合響度調(diào)整的所指示的集合的至少一個(gè)響度調(diào)整符 合值(例如,表2的參數(shù)"響度調(diào)整類(lèi)型");
[0126] 指示已經(jīng)對(duì)相應(yīng)音頻數(shù)據(jù)執(zhí)行的響度處理的至少一種類(lèi)型的至少一個(gè)響度處理 值(例如,表2的參數(shù)"對(duì)白選通響度校正標(biāo)志"、"響度校正類(lèi)型"中的一個(gè)或更多個(gè));以及
[0127] 指示相應(yīng)音頻數(shù)據(jù)的至少一個(gè)響度(例如,峰值或平均響度)特性的至少一個(gè)響度 值(例如,表2的參數(shù)"ITU相對(duì)選通響度"、"ITU語(yǔ)音選通響度"、"ITU (EBU3341)短期3s 響度"和"真實(shí)峰值"中的一個(gè)或更多個(gè))。
[0128] 在一些實(shí)現(xiàn)中,包含PM和/或SSM (以及可選地其他元數(shù)據(jù))的每個(gè)元數(shù)據(jù)段包 含元數(shù)據(jù)段報(bào)頭(以及可選地額外的核心元素)、以及在元數(shù)據(jù)段報(bào)頭(或元數(shù)據(jù)段報(bào)頭和 其他核心元素)之后的具有下面的格式的至少一個(gè)元數(shù)據(jù)有效載荷段:
[0129] 有效載荷報(bào)頭,通常包括至少一個(gè)標(biāo)識(shí)值(例如,SSM或PM格式版本、長(zhǎng)度、周期、 計(jì)數(shù)和子流關(guān)聯(lián)值),以及
[0130] 在有效載荷報(bào)頭之后的SSM或PIM (或另一類(lèi)型的元數(shù)據(jù))。
[0131] 在一些實(shí)現(xiàn)中,由級(jí)107插入至比特流的幀的無(wú)用位段/跳過(guò)字段段(或"addbsi" 字段或輔助數(shù)據(jù)字段)中的元數(shù)據(jù)段(在本文中有時(shí)稱(chēng)為"元數(shù)據(jù)容器"或"容器")中的每 個(gè)具有下面的格式:
[0132] 元數(shù)據(jù)段報(bào)頭(通常包括標(biāo)識(shí)元數(shù)據(jù)段的開(kāi)始的同步字,在同步字之后的標(biāo)識(shí)值, 例如,在下面的表1中表示的版本、長(zhǎng)度、周期、擴(kuò)展的元素計(jì)數(shù)和子流關(guān)聯(lián)值);以及
[0133] 在元數(shù)據(jù)段報(bào)頭之后的有助于元數(shù)據(jù)段或相應(yīng)音頻數(shù)據(jù)的元數(shù)據(jù)的至少一個(gè)的 解密、認(rèn)證或驗(yàn)證中的至少一種的至少一個(gè)保護(hù)值(例如表1的HMAC摘要和音頻指紋值); 以及
[0134] 也在元數(shù)據(jù)段報(bào)頭之后的標(biāo)識(shí)每個(gè)下面的元數(shù)據(jù)有效載荷中的元數(shù)據(jù)的類(lèi)型并 且指示每個(gè)這樣的有效載荷的配置(例如,尺寸)的至少一個(gè)方面的元數(shù)據(jù)有效載荷標(biāo)識(shí) ("ID")值和有效載荷配置值。
[0135] 每個(gè)元數(shù)據(jù)有效載荷在相應(yīng)有效載荷ID值和有效載荷配置值之后。
[0136] 在一些實(shí)施方式中,在幀的無(wú)用位段(或輔助數(shù)據(jù)字段或"addbsi "字段)中的元數(shù) 據(jù)段中的每個(gè)具有三種等級(jí)的結(jié)構(gòu):
[0137] 高等級(jí)結(jié)構(gòu)(例如,元數(shù)據(jù)段報(bào)頭),包括指示無(wú)用位(或輔助數(shù)據(jù)或addbsi)字段 是否包括元數(shù)據(jù)的標(biāo)志、指示存在什么類(lèi)型的元數(shù)據(jù)的至少一個(gè)ID值、以及通常還有指示 (例如,每個(gè)類(lèi)型的)元數(shù)據(jù)的多少位存在(如果元數(shù)據(jù)存在的話(huà))的值??梢源嬖诘脑獢?shù)據(jù) 的一種類(lèi)型為PIM,可以存在的元數(shù)據(jù)的另一類(lèi)型為SSM,而可以存在的元數(shù)據(jù)的其他類(lèi)型 為L(zhǎng)PSM、和/或節(jié)目邊界元數(shù)據(jù)、和/或媒體搜索元數(shù)據(jù);
[0138] 中間等級(jí)結(jié)構(gòu),包括與每個(gè)所標(biāo)識(shí)的類(lèi)型的元數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)(例如,元數(shù)據(jù)有 效載荷報(bào)頭、保護(hù)值、以及關(guān)于每個(gè)所標(biāo)識(shí)的類(lèi)型的元數(shù)據(jù)的有效載荷ID值和有效載荷配 置值);以及
[0139] 低等級(jí)結(jié)構(gòu),包括關(guān)于每個(gè)所標(biāo)識(shí)的類(lèi)型的元數(shù)據(jù)的元數(shù)據(jù)有效載荷(例如,如果 PM被識(shí)別為正存在,一系列PM值,和/或如果該其他類(lèi)型的元數(shù)據(jù)被識(shí)別為正存在,另一 類(lèi)型(例如,SSM或LPSM)的元數(shù)據(jù)值)。
[0140] 這樣三個(gè)等級(jí)結(jié)構(gòu)中的數(shù)據(jù)值可以被嵌套。例如,由高等級(jí)結(jié)構(gòu)和中間等級(jí)結(jié)構(gòu) 標(biāo)識(shí)的每個(gè)有效載荷(例如,每個(gè)PIM、或SSM或其他數(shù)據(jù)有效載荷)的保護(hù)值可以被包括在 有效載荷之后(從而在有效載荷的兀數(shù)據(jù)有效載荷報(bào)頭之后),或由1?等級(jí)結(jié)構(gòu)和中間等級(jí) 結(jié)構(gòu)標(biāo)識(shí)的所有元數(shù)據(jù)有效載荷的保護(hù)值可以被包括在元數(shù)據(jù)段中的最終元數(shù)據(jù)有效載 荷之后(從而在元數(shù)據(jù)段的所有有效載荷的元數(shù)據(jù)有效載荷報(bào)頭之后)。
[0141] 在(參照?qǐng)D8的元數(shù)據(jù)段或"容器"將要描述的)一個(gè)示例中,元數(shù)據(jù)段報(bào)頭標(biāo)識(shí) 4個(gè)元數(shù)據(jù)有效載荷。如圖8所示,元數(shù)據(jù)段報(bào)頭包括容器同步字(被標(biāo)識(shí)為"容器同步") 以及版本和鍵ID值。元數(shù)據(jù)段報(bào)頭之后是4個(gè)元數(shù)據(jù)有效載荷和保護(hù)位。第一有效載荷 (例如,PIM有效載荷)的有效載荷ID值和有效載荷配置(例如,有效載荷尺寸)值在元數(shù)據(jù) 段報(bào)頭之后,第一有效載荷本身在ID和配置值之后,第二有效載荷(例如,SSM有效載荷)的 有效載荷ID值和有效載荷配置(例如,有效載荷尺寸)值在第一有效載荷之后,第二有效載 荷本身在這些ID和配置值之后,第三有效載荷(例如,LPSM有效載荷)的有效載荷ID值和 有效載荷配置(例如,有效載荷尺寸)值在第二有效載荷之后,第三有效載荷本身在這些ID 和配置值之后,第四有效載荷的有效載荷ID值和有效載荷配置(例如,有效載荷尺寸)值在 第三有效載荷之后,第四有效載荷本身在這些ID和配置值之后,而關(guān)于有效載荷中的全部 或一些有效載荷(或關(guān)于高等級(jí)結(jié)構(gòu)和中間等級(jí)結(jié)構(gòu)以及有效載荷中的全部或一些有效載 荷)的保護(hù)值(在圖8中被標(biāo)識(shí)為"保護(hù)數(shù)據(jù)")在最后一個(gè)有效載荷之后。
[0142] 在一些實(shí)施方式中,如果解碼器101接收根據(jù)本發(fā)明的實(shí)施方式生成的具有加密 散列的音頻比特流,則解碼器被配置成根據(jù)由比特流確定的數(shù)據(jù)塊對(duì)加密散列進(jìn)行分析和 檢索,其中所述塊包括元數(shù)據(jù)。驗(yàn)證器102可以使用加密散列對(duì)所接收的比特流和/或相 關(guān)聯(lián)的元數(shù)據(jù)進(jìn)行驗(yàn)證。例如,如果驗(yàn)證器102基于參考加密散列與從數(shù)據(jù)塊檢索到的加 密散列之間的匹配發(fā)現(xiàn)元數(shù)據(jù)是有效的,那么可以禁止處理器103對(duì)相應(yīng)的音頻數(shù)據(jù)的操 作,并且使得選擇級(jí)104通過(guò)(未改變的)音頻數(shù)據(jù)。另外,可選地或可替代地,可以使用其 他類(lèi)型的加密技術(shù)替代基于加密散列的方法。
[0143] 圖2的編碼器100可以確定(響應(yīng)于由解碼器101提取的LPSM以及可選地還響應(yīng) 于節(jié)目邊界元數(shù)據(jù))后處理/預(yù)處理單元已經(jīng)(在元件105、106和107中)對(duì)待編碼的音頻 數(shù)據(jù)執(zhí)行了一種類(lèi)型的響度處理,因此可以(在生成器106中)創(chuàng)建包括用于先前執(zhí)行的響 度處理的和/或根據(jù)先前執(zhí)行的響度處理得到的具體參數(shù)的響度處理狀態(tài)元數(shù)據(jù)。在一些 實(shí)現(xiàn)中,只要編碼器知道已經(jīng)對(duì)音頻內(nèi)容執(zhí)行的處理的類(lèi)型,編碼器100就可以創(chuàng)建指示 對(duì)音頻內(nèi)容的處理歷史的元數(shù)據(jù)(以及將其包括在從編碼器輸出的編碼比特流中)。
[0144] 圖3是為本發(fā)明的音頻處理單元的實(shí)施方式的解碼器(200)以及耦接至解碼器 (200)的后處理器(300)的框圖。后處理器(300)也是本發(fā)明的音頻處理單元的實(shí)施方式。 編碼器200和后處理器300的部件或元件中的任何一個(gè)可以以硬件、軟件或硬件和軟件的 組合被實(shí)現(xiàn)為一個(gè)或更多個(gè)處理和/或一個(gè)或更多個(gè)電路(例如,ASIC、FPGA或其他集成電 路)。解碼器200包括如所示地連接的幀緩沖器201、分析器205、音頻解碼器202、音頻狀態(tài) 驗(yàn)證級(jí)(驗(yàn)證器)203以及控制位生成級(jí)204。通常,解碼器200還包括其他處理元件(未示 出)。
[0145] 幀緩沖器201 (緩沖存儲(chǔ)器)存儲(chǔ)(例如,以非暫態(tài)方式)由解碼器200接收的編碼 音頻比特流的至少一個(gè)幀。編碼音頻比特流的幀序列被從緩沖器201設(shè)定到分析器205。
[0146] 耦接分析器205并且將其配置成從編碼輸入音頻的每個(gè)幀中提取PM和/或SSM (可選地還提取其他元數(shù)據(jù),例如,LPSM),將元數(shù)據(jù)中的至少一些(例如,LPSM和節(jié)目邊界元 數(shù)據(jù),如果任意一個(gè)被提取的話(huà),和/或PIM和/或SSM)設(shè)定到音頻狀態(tài)驗(yàn)證器203和級(jí) 204,將所提取的元數(shù)據(jù)設(shè)定為(例如對(duì)后處理器300的)輸出,從編碼輸入音頻中提取音頻 數(shù)據(jù),以及將所提取的音頻數(shù)據(jù)設(shè)定到解碼器202。
[0147] 輸入至解碼器200的編碼音頻比特流可以是AC-3比特流、E-AC-3比特流或杜比E 比特流中的一個(gè)。
[0148] 圖3的系統(tǒng)還包括后處理器300。后處理器300包括幀緩沖器301和包括耦接至 緩沖器301的至少一個(gè)處理元件的其他處理元件(未示出)。幀緩沖器301存儲(chǔ)(例如,以非 暫態(tài)方式)由后處理器300從解碼器200接收的解碼音頻比特流的至少一個(gè)幀。耦接后處 理器300的處理元件并且將其配置成接收從緩沖器301輸出的解碼音頻比特流的一系列幀 并且使用從解碼器200輸出的元數(shù)據(jù)和/或從解碼器200的級(jí)204輸出的控制位對(duì)其進(jìn)行 自適應(yīng)處理。通常,后處理器300被配置成使用來(lái)自解碼器200的元數(shù)據(jù)對(duì)解碼音頻數(shù)據(jù) 執(zhí)行自適應(yīng)處理(例如,使用LPSM值以及可選地還使用節(jié)目邊界元數(shù)據(jù)對(duì)解碼音頻數(shù)據(jù)執(zhí) 行自適應(yīng)響度處理,其中自適應(yīng)處理可以基于響度處理狀態(tài)、和/或由指示單個(gè)音頻節(jié)目 的音頻數(shù)據(jù)的LPSM所指示的一個(gè)或更多個(gè)音頻數(shù)據(jù)特性)。
[0149] 解碼器200和后處理器300的各種實(shí)現(xiàn)被配置成執(zhí)行本發(fā)明的方法的不同的實(shí)施 方式。
[0150] 解碼器200的音頻解碼器202被配置成對(duì)由分析器205提取的音頻數(shù)據(jù)進(jìn)行解碼 以生成解碼音頻數(shù)據(jù),并且將解碼音頻數(shù)據(jù)設(shè)定為(例如對(duì)后處理器300的)輸出。
[0151] 狀態(tài)驗(yàn)證器203被配置成對(duì)設(shè)定到其的元數(shù)據(jù)進(jìn)行認(rèn)證和驗(yàn)證。在一些實(shí)施方式 中,元數(shù)據(jù)為(或被包括在)已經(jīng)被包括在輸入比特流(例如,根據(jù)本發(fā)明的實(shí)施方式)中的 數(shù)據(jù)塊。塊可以包括用于對(duì)元數(shù)據(jù)和/或基本音頻數(shù)據(jù)(從分析器205和/或解碼器202 提供至驗(yàn)證器203)進(jìn)行處理的加密散列(基于散列的消息認(rèn)證代碼或"HMAC")。數(shù)據(jù)塊可 以在這些實(shí)施方式中被數(shù)字地標(biāo)記,使得下游的音頻處理單元可以相對(duì)容易地認(rèn)證和驗(yàn)證 處理狀態(tài)元數(shù)據(jù)。
[0152] 包括但不限于一個(gè)或更多個(gè)非HMAC加密方法中的任意一個(gè)的其他加密方法可以 用于元數(shù)據(jù)的驗(yàn)證(例如,在驗(yàn)證器203中)以確保元數(shù)據(jù)和/或基本的音頻數(shù)據(jù)的安全的 傳輸和接收。例如,驗(yàn)證(使用這樣的加密方法)可以在接收本發(fā)明的音頻比特流的實(shí)施方 式的每個(gè)音頻處理單元中被執(zhí)行以確定包括在該比特流中的元數(shù)據(jù)和相應(yīng)音頻數(shù)據(jù)是否 已經(jīng)經(jīng)歷(和/或產(chǎn)生于)具體的處理(由元數(shù)據(jù)所指示的)并且在這樣的具體的處理執(zhí)行 之后沒(méi)有被修改。
[0153] 狀態(tài)驗(yàn)證器203將控制數(shù)據(jù)設(shè)定到控制位生成器204,和/或?qū)⒖刂茢?shù)據(jù)設(shè)定為輸 出(例如,設(shè)定到后處理器300)以指示驗(yàn)證操作的結(jié)果。響應(yīng)于控制數(shù)據(jù)(以及可選地從輸 入比特流中提取的其他元數(shù)據(jù)),級(jí)204可以生成(以及設(shè)定到后處理器300) :
[0154] 指示從解碼器202輸出的解碼音頻數(shù)據(jù)已經(jīng)經(jīng)歷特定類(lèi)型的響度處理(當(dāng)LPSM指 示從解碼器202輸出的音頻數(shù)據(jù)已經(jīng)經(jīng)歷該特定類(lèi)型的響度處理,并且來(lái)自驗(yàn)證器203的 控制位指示LPSM有效時(shí))的控制位;或
[0155] 指示從解碼器202輸出的解碼音頻數(shù)據(jù)應(yīng)當(dāng)經(jīng)歷特定類(lèi)型的響度處理(例如,當(dāng) LPSM指示從解碼器202輸出的音頻數(shù)據(jù)沒(méi)有經(jīng)歷具體類(lèi)型的響度處理,或當(dāng)LPSM指示從解 碼器202輸出的音頻數(shù)據(jù)已經(jīng)經(jīng)歷該特定類(lèi)型的響度處理但來(lái)自驗(yàn)證器203的控制位指示 LPSM無(wú)效時(shí))的控制位。
[0156] 或者,解碼器200將由解碼器202從輸入比特流中提取的元數(shù)據(jù)以及由分析器205 從輸入比特流中提取的元數(shù)據(jù)設(shè)定到后處理器300,并且后處理器300使用元數(shù)據(jù)對(duì)解碼 音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理,或執(zhí)行元數(shù)據(jù)的驗(yàn)證,然后如果驗(yàn)證指示元數(shù)據(jù)有效,則使用元 數(shù)據(jù)對(duì)解碼音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理。
[0157] 在一些實(shí)施方式中,如果解碼器200接收根據(jù)本發(fā)明的使用加密散列的實(shí)施方式 生成的的音頻比特流,則解碼器被配置成對(duì)來(lái)自由比特流所確定的數(shù)據(jù)塊的加密散列進(jìn)行 分析和檢索,所述塊包括響度處理狀態(tài)元數(shù)據(jù)(LPSM)。驗(yàn)證器203可以使用加密散列以對(duì) 接收的比特流和/或相關(guān)聯(lián)的元數(shù)據(jù)進(jìn)行驗(yàn)證。例如,如果驗(yàn)證器203基于參考加密散列 與從數(shù)據(jù)塊檢索的加密散列之間的匹配發(fā)現(xiàn)LPSM有效,那么可以用向下游的音頻處理單 元(例如,可以是或包括音量校平單元的后處理器300)發(fā)信號(hào)以通過(guò)(未改變的)比特流的 音頻數(shù)據(jù)。另外地,可選地或可替代地,可以使用其他類(lèi)型的加密技術(shù)替代基于加密散列的 方法。
[0158] 在解碼器200的一些實(shí)現(xiàn)中,所接收(以及緩存在存儲(chǔ)器201中)的編碼比特流為 AC-3比特流或E-AC-3比特流,并且包括音頻數(shù)據(jù)段(例如,圖4所示的幀的ABO至AB5段) 和元數(shù)據(jù)段,其中音頻數(shù)據(jù)段指示音頻數(shù)據(jù),而元數(shù)據(jù)段中的至少一些中的每個(gè)包括PIM 或SSM (或其他元數(shù)據(jù))。解碼器級(jí)202 (和/或分析器205)被配置成從比特流中提取元數(shù) 據(jù)。元數(shù)據(jù)段中的包括PIM和/或SSM (可選地還包括其他元數(shù)據(jù))的每個(gè)元數(shù)據(jù)段被包括 在比特流的幀的無(wú)用位段中,或比特流的幀的比特流信息("BSI")段的"addbsi"字段中, 或比特流的幀的結(jié)束處的輔助數(shù)據(jù)字段(例如,圖4所示的AUX段)中。比特流的幀可以包 括一個(gè)或兩個(gè)元數(shù)據(jù)段,其中每個(gè)元數(shù)據(jù)段包括元數(shù)據(jù),并且如果幀包括兩個(gè)元數(shù)據(jù)段,一 個(gè)可以存在于幀的addbsi字段中而另一個(gè)存在于幀的AUX字段中。
[0159] 在一些實(shí)施方式中,緩存在緩沖器201中的比特流的每個(gè)元數(shù)據(jù)段(在本文中有 時(shí)稱(chēng)為"容器")具有包括元數(shù)據(jù)段報(bào)頭(可選地還包括其他強(qiáng)制的或"核心"元素)、以及在 元數(shù)據(jù)段報(bào)頭之后的一個(gè)或更多個(gè)元數(shù)據(jù)有效載荷的格式。如果存在,SIM被包括在元數(shù) 據(jù)有效載荷中的一個(gè)有效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有第一類(lèi)型的格式)中。 如果存在,PIM被包括在元數(shù)據(jù)有效載荷中的另一個(gè)有效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且 通常具有第二類(lèi)型的格式)中。類(lèi)似地,元數(shù)據(jù)的其他類(lèi)型(如果存在)被包括在元數(shù)據(jù)有 效載荷中的另一有效載荷(由有效載荷報(bào)頭標(biāo)識(shí),并且通常具有針對(duì)元數(shù)據(jù)的類(lèi)型的格式) 中。示例性格式使得能夠在除了解碼期間之外的時(shí)間方便訪(fǎng)問(wèn)(例如,由解碼之后的后處 理器300、或由被配置成在沒(méi)有對(duì)編碼比特流執(zhí)行完全解碼的情況下識(shí)別元數(shù)據(jù)的處理器) SSM、PIM和其他元數(shù)據(jù),并且允許在比特流的解碼期間(例如,子流識(shí)別的)方便和高效的誤 差檢測(cè)和校正。例如,在不以示例性格式訪(fǎng)問(wèn)SSM的情況下,解碼器200可能錯(cuò)誤地識(shí)別與 節(jié)目相關(guān)聯(lián)的子流的正確數(shù)量。元數(shù)據(jù)段中的一個(gè)元數(shù)據(jù)有效載荷可以包括SSM,元數(shù)據(jù)段 中的另一個(gè)元數(shù)據(jù)有效載荷可以包括PIM,以及可選地,元數(shù)據(jù)段中的至少一個(gè)其他元數(shù)據(jù) 有效載荷可以包括其他元數(shù)據(jù)(例如,響度處理狀態(tài)元數(shù)據(jù)或"LPSM")。
[0160] 在一些實(shí)施方式中,包括在緩存在緩沖器201中的編碼比特流(例如,指示至少一 個(gè)音頻節(jié)目的E-AC-3比特流)的幀中的子流結(jié)構(gòu)元數(shù)據(jù)(SSM)有效載荷包括下面的格式的 SSM :
[0161] 有效載荷報(bào)頭,通常包括至少一個(gè)標(biāo)識(shí)值(例如,指示SSM格式版本的2位值,以及 可選地長(zhǎng)度、周期、計(jì)數(shù)和子流關(guān)聯(lián)值);以及
[0162] 在報(bào)頭之后:
[0163] 指示由比特流指示的節(jié)目的獨(dú)立子流的數(shù)量的獨(dú)立子流元數(shù)據(jù);以及
[0164] 從屬子流元數(shù)據(jù),其指示:節(jié)目的每個(gè)獨(dú)立子流是否具有至少一個(gè)與其相關(guān)聯(lián)的 從屬子流,以及如果節(jié)目的每個(gè)獨(dú)立子流具有至少一個(gè)與其相關(guān)聯(lián)的從屬子流,與節(jié)目的 每個(gè)獨(dú)立子流相關(guān)聯(lián)的從屬子流的數(shù)量。
[0165] 在一些實(shí)施方式中,緩存在緩沖器201中的編碼比特流(例如,指示至少一個(gè)音頻 節(jié)目的E-AC-3比特流)的幀中的包括的節(jié)目信息元數(shù)據(jù)(PM)有效載荷具有下面的格式:
[0166] 有效載荷報(bào)頭,通常包括至少一個(gè)標(biāo)識(shí)值(例如,指示PM格式版本的值,以及可 選地長(zhǎng)度、周期、計(jì)數(shù)和子流關(guān)聯(lián)值);以及在報(bào)頭之后,下面的格式的PIM :
[0167] 音頻節(jié)目的每個(gè)靜音通道和每個(gè)非靜音通道(S卩,節(jié)目的哪些通道包含音頻信息, 而哪些通道(如果有)僅包含靜音(通常關(guān)于幀的持續(xù)時(shí)間))的活動(dòng)通道元數(shù)據(jù)。在編碼比 特流是AC-3或E-AC-3比特流的實(shí)施方式中,比特流的幀中的活動(dòng)通道元數(shù)據(jù)可以結(jié)合比 特流的額外的元數(shù)據(jù)(例如,幀的音頻編碼模式("acmod")字段,以及如果存在,幀或相關(guān)聯(lián) 的從屬子流幀中的chanmap字段)以確定節(jié)目的哪些通道包含音頻信息而哪些通道包含靜 音;
[0168] 下混合處理狀態(tài)元數(shù)據(jù),其指示:節(jié)目是否被下混合(在編碼之前或在編碼期間), 以及如果節(jié)目被下混合,所應(yīng)用的下混合的類(lèi)型。下混合處理狀態(tài)元數(shù)據(jù)可以有助于實(shí)現(xiàn) 解碼器的上混合(在后處理器300中)下游,例如以使用最匹配所應(yīng)用的下混合的類(lèi)型的參 數(shù)對(duì)節(jié)目的音頻內(nèi)容進(jìn)行上混合。在編碼比特流是AC-3或E-AC-3比特流的實(shí)施方式中, 下混合處理狀態(tài)元數(shù)據(jù)可以結(jié)合幀的音頻編碼模型("acmod")字段以確定應(yīng)用于節(jié)目的通 道的下混合(如果有)的類(lèi)型;
[0169] 上混合處理狀態(tài)元數(shù)據(jù),其指示:在編碼之前或在編碼期間節(jié)目是否被上混合(例 如,從較小數(shù)量的通道),以及如果節(jié)目被上混合,所應(yīng)用的上混合的類(lèi)型。上混合處理狀態(tài) 元數(shù)據(jù)可以有助于實(shí)現(xiàn)解碼器的下混合(在后處理器中)下游,例如以與應(yīng)用于節(jié)目的上混 合(例如,杜比定向邏輯、或杜比定向邏輯II電影模式、或杜比定向邏輯II音樂(lè)模式、或杜比 專(zhuān)業(yè)上混合器)的類(lèi)型一致的方式對(duì)節(jié)目的音頻內(nèi)容進(jìn)行下混合。在編碼比特流是E-AC-3 比特流的實(shí)施方式中,上混合處理狀態(tài)元數(shù)據(jù)可以結(jié)合其他元數(shù)據(jù)(例如,幀的"strmtyp" 字段的值)以確定應(yīng)用于節(jié)目的通道的上混合(如果有)的類(lèi)型。(E-AC-3比特流的幀的BSI 字段中的)"strmtyp"字段的值指示幀的音頻內(nèi)容是否屬于獨(dú)立流(其確定節(jié)目)或(包括 多個(gè)子流或與多個(gè)子流相關(guān)聯(lián)的節(jié)目的)獨(dú)立子流,從而可以獨(dú)立于由E-AC-3比特流所指 示的任何其他子流被編碼,或幀的音頻內(nèi)容是否屬于(包括多個(gè)子流或與多個(gè)子流相關(guān)聯(lián) 的節(jié)目的)從屬子流,從而必須結(jié)合與其相關(guān)聯(lián)的獨(dú)立子流而被解碼;以及
[0170] 預(yù)處理狀態(tài)元數(shù)據(jù),其指示:是否對(duì)幀的音頻內(nèi)容執(zhí)行了預(yù)處理(在生成編碼比 特流的音頻內(nèi)容的編碼之前),以及如果對(duì)幀音頻內(nèi)容執(zhí)行了預(yù)處理,被執(zhí)行的預(yù)處理的類(lèi) 型。
[0171] 在一些實(shí)現(xiàn)中,預(yù)處理狀態(tài)元數(shù)據(jù)指示:
[0172] 是否應(yīng)用了環(huán)繞衰減(例如,在編碼之前,音頻節(jié)目的環(huán)繞通道是否被衰減了 3dB),
[0173] 是否(例如,在編碼之前對(duì)音頻節(jié)目的環(huán)繞通道Ls和Rs通道)應(yīng)用了 90°相移,
[0174] 在編碼之前,是否對(duì)音頻節(jié)目的LFE通道應(yīng)用了低通濾波器,
[0175] 在生成期間,是否監(jiān)視節(jié)目的LFE通道的電平,以及如果監(jiān)視了節(jié)目的LFE通道的 電平,相對(duì)于節(jié)目的全音域音頻通道的電平的LFE通道的監(jiān)視電平,
[0176] 是否應(yīng)當(dāng)對(duì)節(jié)目的解碼音頻的每個(gè)塊執(zhí)行(例如,在解碼器中)動(dòng)態(tài)范圍壓縮,以 及如果應(yīng)當(dāng)對(duì)節(jié)目的解碼音頻的每個(gè)塊執(zhí)行動(dòng)態(tài)范圍壓縮,要執(zhí)行的動(dòng)態(tài)范圍壓縮的類(lèi)型 (和/或參數(shù))(例如,該類(lèi)型的預(yù)處理狀態(tài)元數(shù)據(jù)可以指示下面的壓縮配置文件類(lèi)型中的哪 種類(lèi)型由編碼器假定以生成被包括在編碼比特流中的動(dòng)態(tài)范圍壓縮控制值:電影標(biāo)準(zhǔn)、電 影光線(xiàn)、音樂(lè)標(biāo)準(zhǔn)、音樂(lè)光線(xiàn)或語(yǔ)音?;蛘?,預(yù)處理狀態(tài)元數(shù)據(jù)的該類(lèi)型可以指示應(yīng)當(dāng)以由 被包括在編碼比特流中的動(dòng)態(tài)范圍壓縮控制值確定的方式對(duì)節(jié)目的解碼音頻內(nèi)容的每個(gè) 幀執(zhí)行重動(dòng)態(tài)范圍壓縮(" compr "壓縮)),
[0177] 是否使用譜擴(kuò)展和/或通道耦合編碼以對(duì)特定頻率范圍的節(jié)目的內(nèi)容進(jìn)行編碼, 以及如果使用譜擴(kuò)展和/或通道耦合編碼以對(duì)特定頻率范圍的節(jié)目的內(nèi)容進(jìn)行編碼,對(duì)其 執(zhí)行譜擴(kuò)展編碼的內(nèi)容的頻率分量的最小頻率和最大頻率,以及對(duì)其執(zhí)行通道耦合編碼的 內(nèi)容的頻率分量的最小頻率和最大頻率。該類(lèi)型的預(yù)處理狀態(tài)元數(shù)據(jù)信息可以有助于執(zhí)行 解碼器的均衡(在后處理器中)下游。通道耦合信息和譜擴(kuò)展信息兩者也有助于在代碼轉(zhuǎn)換 操作和應(yīng)用期間優(yōu)化質(zhì)量。例如,編碼器可以基于參數(shù)(例如譜擴(kuò)展和通道耦合信息)的狀 態(tài)優(yōu)化其行為(包括預(yù)處理步驟例如頭戴式耳機(jī)虛擬、上混合等的自適應(yīng))。而且,編碼器可 以基于進(jìn)入的(并且認(rèn)證的)元數(shù)據(jù)的狀態(tài)動(dòng)態(tài)地修改其耦合和譜擴(kuò)展參數(shù)以匹配最佳值 和/或?qū)⑵漶詈虾妥V擴(kuò)展參數(shù)修改成最佳值,以及
[0178] 對(duì)白增強(qiáng)調(diào)整范圍數(shù)據(jù)是否包括在編碼比特流中,以及如果對(duì)白增強(qiáng)調(diào)整范圍數(shù) 據(jù)包括在編碼比特流中,在相對(duì)于音頻節(jié)目中的非對(duì)白內(nèi)容的電平調(diào)整對(duì)白內(nèi)容的電平的 對(duì)白增強(qiáng)處理(例如,在解碼器的后處理器下游)的執(zhí)行期間可得到的調(diào)整范圍。
[0179] 在一些實(shí)施方式中,包括在緩存在緩沖器201中的編碼比特流(例如,指示至少一 個(gè)音頻節(jié)目的E-AC-3比特流)的幀中的LPSM有效載荷包括下面的格式的LPSM :
[0180] 報(bào)頭(通常包括標(biāo)識(shí)LPSM有效載荷的開(kāi)始的同步字,在同步字之后的至少一個(gè)標(biāo) 識(shí)值,例如,在下面的表2中指示的LPSM格式版本、長(zhǎng)度、周期、計(jì)數(shù)和子流關(guān)聯(lián)值);以及
[0181] 在報(bào)頭之后的:
[0182] 指示相應(yīng)音頻數(shù)據(jù)指示對(duì)白或不指示對(duì)白(例如,相應(yīng)音頻數(shù)據(jù)的哪些通道指示 對(duì)白)的至少一個(gè)對(duì)白表示值(例如,表2的參數(shù)"對(duì)白通道");
[0183] 指示相應(yīng)音頻內(nèi)容是否符合響度調(diào)整的所指示的集合的至少一個(gè)響度調(diào)整符合 值(例如,表2的參數(shù)"響度調(diào)整類(lèi)型");
[0184] 指示已經(jīng)對(duì)相應(yīng)音頻數(shù)據(jù)執(zhí)行的至少一種類(lèi)型的響度處理的至少一個(gè)響度處理 值(例如,表2的參數(shù)"對(duì)白選通響度校正標(biāo)志"、"響度校正類(lèi)型"中的一個(gè)或更多個(gè));以及
[0185] 指示相應(yīng)音頻數(shù)據(jù)的至少一個(gè)響度(例如,峰值或平均響度)特性的至少一個(gè)響度 值(例如,表2的參數(shù)"ITU相對(duì)選通響度"、"ITU語(yǔ)音選通響度"、"ITU (EBU3341)短期3s 響度"和"真實(shí)峰值"中的一個(gè)或更多個(gè))。
[0186] 在一些實(shí)現(xiàn)中,分析器205 (和/或解碼器級(jí)202)被配置成從比特流的幀的無(wú)用 位段或"addbsi "字段或輔助數(shù)據(jù)段中提取具有下面的格式的每個(gè)元數(shù)據(jù)段:
[0187] 元數(shù)據(jù)段報(bào)頭(通常包括標(biāo)識(shí)元數(shù)據(jù)段的開(kāi)始的同步字,同步字之后的標(biāo)識(shí)值,例 如版本、長(zhǎng)度、周期、擴(kuò)展的元素計(jì)數(shù)和子流關(guān)聯(lián)值);以及
[0188] 在元數(shù)據(jù)段報(bào)頭之后的有助于元數(shù)據(jù)段或相應(yīng)音頻數(shù)據(jù)的元數(shù)據(jù)的至少一個(gè)的 解密、認(rèn)證或驗(yàn)證中的至少一種的至少一個(gè)保護(hù)值(例如,表1的HMAC摘要和音頻指紋值); 以及
[0189] 也在元數(shù)據(jù)段報(bào)頭之后的標(biāo)識(shí)每個(gè)下面的元數(shù)據(jù)有效載荷中的元數(shù)據(jù)的類(lèi)型并 且表示每個(gè)這樣的有效載荷的配置(例如,尺寸)的至少一個(gè)方面的元數(shù)據(jù)有效載荷標(biāo)識(shí) ("ID")值和有效載荷配置值。
[0190] 每個(gè)元數(shù)據(jù)有效載荷段(優(yōu)選地具有上面指定的格式)在相應(yīng)的元數(shù)據(jù)有效載荷 ID值和元數(shù)據(jù)配置值之后。
[0191] 更一般地,由本發(fā)明的優(yōu)選實(shí)施方式生成的編碼音頻比特流具有提供將元數(shù)據(jù)元 素和子元素標(biāo)記為核心的(強(qiáng)制的)或擴(kuò)展的(可選的)元素或子元素的機(jī)制的結(jié)構(gòu)。這使 得比特流(包括其元數(shù)據(jù))的數(shù)據(jù)速率能夠擴(kuò)展到大量的應(yīng)用。優(yōu)選的比特流語(yǔ)法的核心的 (強(qiáng)制的)元素還應(yīng)當(dāng)能夠用信號(hào)通知與音頻內(nèi)容相關(guān)聯(lián)的擴(kuò)展的(可選的)元素存在于(帶 中)和/或遠(yuǎn)程位置(帶外)。
[0192] 要求核心元素存在于比特流的每個(gè)幀中。核心元素的一些子元素是可選的,并且 可以以任何組合存在。不要求擴(kuò)展元素存在于每個(gè)幀中(以限制比特率總開(kāi)銷(xiāo))。從而,擴(kuò) 展元素可以存在于一些幀中而不存于其他幀中。擴(kuò)展元素的一些子元素是可選的,并且可 以以任何組合存在,然而,擴(kuò)展元素的一些子元素可以是強(qiáng)制的(即,如果擴(kuò)展元素存在于 比特流的幀中)。
[0193] 在一類(lèi)實(shí)施方式中,生成(例如,通過(guò)實(shí)現(xiàn)本發(fā)明的音頻處理單元)包括一系列音 頻數(shù)據(jù)段和元數(shù)據(jù)段的編碼音頻比特流。音頻數(shù)據(jù)段指示音頻數(shù)據(jù),元數(shù)據(jù)段中的至少一 些中的每個(gè)包括PM和/或SSM (以及可選地至少一種其他類(lèi)型的元數(shù)據(jù)),并且音頻數(shù)據(jù) 段被與元數(shù)據(jù)段時(shí)分復(fù)用。在該類(lèi)中的優(yōu)選實(shí)施方式中,元數(shù)據(jù)段中的每個(gè)具有在本文中 要描述的優(yōu)選的格式。
[0194] 在一種優(yōu)選的格式中,編碼比特流為AC-3比特流或E-AC-3比特流,并且元數(shù)據(jù)段 中的包括SSM和/或PIM的每個(gè)元數(shù)據(jù)段被包括(例如,由編碼器100的優(yōu)選的實(shí)現(xiàn)的級(jí) 107)作為比特流的幀的比特流信息("BSI")段的"addbsi"字段(圖6所示)、或比特流的幀 的輔助數(shù)據(jù)字段中、或比特流的幀的無(wú)用位段中的額外的比特流信息。
[0195] 在優(yōu)選格式中,幀中的每個(gè)包括幀的無(wú)用位段(或addbsi字段)中的元數(shù)據(jù)段(在 本文中有時(shí)也稱(chēng)為元數(shù)據(jù)容器或容器)。元數(shù)據(jù)段具有下面表1中所示的強(qiáng)制的元素(統(tǒng)一 稱(chēng)為"核心元素(并且可以包括表1中所示的可選元素)。表1中所示的需要的元素中 的至少一些被包括在元數(shù)據(jù)段的元數(shù)據(jù)段報(bào)頭中,但一些可以被包括在元數(shù)據(jù)段的其他位 置:
[0196] 表 1
[0197]

【權(quán)利要求】
1. 一種音頻處理單元,包括: 緩沖存儲(chǔ)器;以及 至少一個(gè)處理子系統(tǒng),其耦接至所述緩沖存儲(chǔ)器,其中所述緩沖存儲(chǔ)器存儲(chǔ)編碼音頻 比特流的至少一個(gè)幀,所述幀包括在所述幀的至少一個(gè)跳過(guò)字段的至少一個(gè)元數(shù)據(jù)段中的 節(jié)目信息元數(shù)據(jù)或子流結(jié)構(gòu)元數(shù)據(jù)以及在所述幀的至少一個(gè)其他段中的音頻數(shù)據(jù),其中所 述處理子系統(tǒng)被耦接并且被配置成使用所述比特流的元數(shù)據(jù)執(zhí)行所述比特流的生成、所述 比特流的解碼或所述比特流的音頻數(shù)據(jù)的自適應(yīng)處理中的至少一種,或使用所述比特流的 元數(shù)據(jù)執(zhí)行所述比特流的音頻數(shù)據(jù)或元數(shù)據(jù)中至少之一的認(rèn)證或驗(yàn)證中的至少一種, 其中,所述元數(shù)據(jù)段包括至少一個(gè)元數(shù)據(jù)有效載荷,所述元數(shù)據(jù)有效載荷包括: 報(bào)頭;以及 在所述報(bào)頭之后的,所述節(jié)目信息元數(shù)據(jù)的至少一部分或所述子流結(jié)構(gòu)元數(shù)據(jù)的至少 一部分。
2. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述編碼音頻比特流指示至少一個(gè) 音頻節(jié)目,并且所述元數(shù)據(jù)段包括節(jié)目信息元數(shù)據(jù)有效載荷,所述節(jié)目元數(shù)據(jù)有效載荷包 括: 節(jié)目信息元數(shù)據(jù)報(bào)頭;以及 在所述節(jié)目信息元數(shù)據(jù)報(bào)頭之后的,指示所述節(jié)目的音頻內(nèi)容的至少一個(gè)屬性或特性 的節(jié)目信息元數(shù)據(jù),所述節(jié)目信息元數(shù)據(jù)包括指示所述節(jié)目的每個(gè)非靜音通道和每個(gè)靜音 通道的活動(dòng)通道元數(shù)據(jù)。
3. 根據(jù)權(quán)利要求2所述的音頻處理單元,其中,所述節(jié)目信息元數(shù)據(jù)還包括下列之一: 下混合處理狀態(tài)元數(shù)據(jù),其指示:所述節(jié)目是否是下混合過(guò)的,以及在所述節(jié)目是下混 合過(guò)的情況下應(yīng)用于所述節(jié)目的下混合的類(lèi)型; 上混合處理狀態(tài)元數(shù)據(jù),其指示:所述節(jié)目是否是上混合過(guò)的,以及在所述節(jié)目是上混 合過(guò)的情況下應(yīng)用于所述節(jié)目的上混合的類(lèi)型; 預(yù)處理狀態(tài)元數(shù)據(jù),其指示:是否對(duì)所述幀的音頻內(nèi)容執(zhí)行了預(yù)處理,以及在對(duì)所述幀 的音頻內(nèi)容執(zhí)行了預(yù)處理的情況下對(duì)所述音頻內(nèi)容執(zhí)行的預(yù)處理的類(lèi)型;或 譜擴(kuò)展處理或通道耦合元數(shù)據(jù),其指示:是否對(duì)所述節(jié)目應(yīng)用了譜擴(kuò)展處理或通道耦 合,以及在對(duì)所述節(jié)目應(yīng)用了譜擴(kuò)展處理或通道耦合的情況下應(yīng)用譜擴(kuò)展或通道耦合的頻 率范圍。
4. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述編碼音頻比特流指示具有音頻內(nèi) 容的至少一個(gè)獨(dú)立子流的至少一個(gè)音頻節(jié)目,而所述元數(shù)據(jù)段包括子流結(jié)構(gòu)元數(shù)據(jù)有效載 荷,所述子流結(jié)構(gòu)元數(shù)據(jù)有效載荷包括: 子流結(jié)構(gòu)元數(shù)據(jù)有效載荷報(bào)頭;以及 在所述子流結(jié)構(gòu)元數(shù)據(jù)有效載荷報(bào)頭之后的,指示所述節(jié)目的獨(dú)立子流的數(shù)量的獨(dú)立 子流元數(shù)據(jù),以及指示所述節(jié)目的每個(gè)獨(dú)立子流是否具有至少一個(gè)相關(guān)聯(lián)的從屬子流的從 屬子流元數(shù)據(jù)。
5. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述元數(shù)據(jù)段包括: 元數(shù)據(jù)段報(bào)頭; 在所述元數(shù)據(jù)段報(bào)頭之后的至少一個(gè)保護(hù)值,其用于所述節(jié)目信息元數(shù)據(jù)、或所述子 流結(jié)構(gòu)元數(shù)據(jù)、或與所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元數(shù)據(jù)相對(duì)應(yīng)的所述音頻數(shù)據(jù)中 至少之一的解密、認(rèn)證或驗(yàn)證中的至少一種;以及 在所述元數(shù)據(jù)段報(bào)頭之后的元數(shù)據(jù)有效載荷標(biāo)識(shí)值和有效載荷配置值,其中所述元數(shù) 據(jù)有效載荷在所述元數(shù)據(jù)有效載荷標(biāo)識(shí)值和所述有效載荷配置值之后。
6. 根據(jù)權(quán)利要求5所述的音頻處理單元,其中,所述元數(shù)據(jù)段報(bào)頭包括標(biāo)識(shí)所述元數(shù) 據(jù)段的開(kāi)始的同步字、以及在所述同步字之后的至少一個(gè)標(biāo)識(shí)值,并且所述元數(shù)據(jù)有效載 荷的所述報(bào)頭包括至少一個(gè)標(biāo)識(shí)值。
7. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述編碼音頻比特流為AC-3比特流或 E-AC-3比特流。
8. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述緩沖存儲(chǔ)器以非暫態(tài)方式存儲(chǔ)所 述幀。
9. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述音頻處理單元為編碼器。
10. 根據(jù)權(quán)利要求9所述的音頻處理單元,其中,所述處理子系統(tǒng)包括: 解碼子系統(tǒng),其被配置成接收輸入音頻比特流并且從所述輸入音頻比特流中提取輸入 元數(shù)據(jù)和輸入音頻數(shù)據(jù); 自適應(yīng)處理子系統(tǒng),其被耦接并且被配置成使用所述輸入元數(shù)據(jù)對(duì)所述輸入音頻數(shù)據(jù) 執(zhí)行自適應(yīng)處理,由此生成經(jīng)處理音頻數(shù)據(jù);以及 編碼子系統(tǒng),其被耦接并且被配置成響應(yīng)于所述經(jīng)處理音頻數(shù)據(jù),包括通過(guò)將所述節(jié) 目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元數(shù)據(jù)包括在所述編碼音頻比特流中,來(lái)生成所述編碼音頻 比特流,并且將所述編碼音頻比特流設(shè)定到所述緩沖存儲(chǔ)器。
11. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述音頻處理單元為解碼器。
12. 根據(jù)權(quán)利要求11所述的音頻處理單元,其中,所述處理子系統(tǒng)為耦接至所述緩沖 存儲(chǔ)器并且被配置成從所述編碼音頻比特流中提取所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu) 元數(shù)據(jù)的解碼子系統(tǒng)。
13. 根據(jù)權(quán)利要求1所述的音頻處理單元,包括: 子系統(tǒng),其被耦接至所述緩沖存儲(chǔ)器并且被配置成:從所述編碼音頻比特流中提取所 述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元數(shù)據(jù),以及從所述編碼音頻比特流中提取所述音頻數(shù) 據(jù);以及 后處理器,其被耦接至所述子系統(tǒng)并且被配置成使用從所述編碼音頻比特流中提取的 所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元數(shù)據(jù)中至少之一對(duì)所述音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理。
14. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述音頻處理單元為數(shù)字信號(hào)處理 器。
15. 根據(jù)權(quán)利要求1所述的音頻處理單元,其中,所述音頻處理單元為預(yù)處理器,所述 預(yù)處理器被配置成從所述編碼音頻比特流中提取所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元 數(shù)據(jù)以及所述音頻數(shù)據(jù),并且使用從所述編碼音頻比特流中提取的所述節(jié)目信息元數(shù)據(jù)或 所述子流結(jié)構(gòu)元數(shù)據(jù)中至少之一對(duì)所述音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理。
16. -種用于對(duì)編碼音頻比特流進(jìn)行解碼的方法,所述方法包括以下步驟: 接收編碼音頻比特流;以及 從所述編碼音頻比特流中提取元數(shù)據(jù)和音頻數(shù)據(jù),其中所述元數(shù)據(jù)是或包括節(jié)目信息 元數(shù)據(jù)和子流結(jié)構(gòu)元數(shù)據(jù), 其中,所述編碼音頻比特流包括一系列幀并且指示至少一個(gè)音頻節(jié)目,所述節(jié)目信息 元數(shù)據(jù)和所述子流結(jié)構(gòu)元數(shù)據(jù)指示所述節(jié)目,所述幀中的每個(gè)包括至少一個(gè)音頻數(shù)據(jù)段, 每個(gè)所述音頻數(shù)據(jù)段包括所述音頻數(shù)據(jù)的至少一部分,所述幀的至少一個(gè)子集中的每個(gè)幀 包括元數(shù)據(jù)段,并且每個(gè)所述元數(shù)據(jù)段包括所述節(jié)目信息元數(shù)據(jù)的至少一部分以及所述子 流結(jié)構(gòu)元數(shù)據(jù)的至少一部分。
17. 根據(jù)權(quán)利要求16所述的方法,其中,所述元數(shù)據(jù)段包括節(jié)目信息元數(shù)據(jù)有效載荷, 所述節(jié)目信息元數(shù)據(jù)有效載荷包括: 節(jié)目信息元數(shù)據(jù)報(bào)頭;以及 在所述節(jié)目信息元數(shù)據(jù)報(bào)頭之后的指示所述節(jié)目的音頻內(nèi)容的至少一個(gè)屬性或特性 的節(jié)目信息元數(shù)據(jù),所述節(jié)目信息元數(shù)據(jù)包括指示所述節(jié)目的每個(gè)非靜音通道和每個(gè)靜音 通道的活動(dòng)通道元數(shù)據(jù)。
18. 根據(jù)權(quán)利要求17所述的方法,其中,所述節(jié)目信息元數(shù)據(jù)還包括下列中的至少一 個(gè): 下混合處理狀態(tài)元數(shù)據(jù),其指示:所述節(jié)目是否是下混合過(guò)的,以及在所述節(jié)目是下混 合過(guò)的情況下應(yīng)用于所述節(jié)目的下混合的類(lèi)型; 上混合處理狀態(tài)元數(shù)據(jù),其指示:所述節(jié)目是否是上混合過(guò)的,以及在所述節(jié)目是上混 合過(guò)的情況下應(yīng)用于所述節(jié)目的上混合的類(lèi)型;或 預(yù)處理狀態(tài)元數(shù)據(jù),其指示:是否對(duì)所述幀的音頻內(nèi)容執(zhí)行了預(yù)處理,以及在對(duì)所述幀 的音頻內(nèi)容執(zhí)行了預(yù)處理的情況下對(duì)所述音頻內(nèi)容執(zhí)行的預(yù)處理的類(lèi)型。
19. 根據(jù)權(quán)利要求16的方法,其中,所述編碼音頻比特流指示具有音頻內(nèi)容的至少一 個(gè)獨(dú)立子流的至少一個(gè)音頻節(jié)目,并且所述元數(shù)據(jù)段包括子流結(jié)構(gòu)元數(shù)據(jù)有效載荷,所述 子流結(jié)構(gòu)元數(shù)據(jù)有效載荷包括: 子流結(jié)構(gòu)元數(shù)據(jù)有效載荷報(bào)頭;以及 在所述子流結(jié)構(gòu)元數(shù)據(jù)有效載荷報(bào)頭之后的,指示所述節(jié)目的獨(dú)立子流的數(shù)量的獨(dú)立 子流元數(shù)據(jù)以及指示所述節(jié)目的每個(gè)獨(dú)立子流是否具有至少一個(gè)相關(guān)聯(lián)的從屬子流的從 屬子流元數(shù)據(jù)。
20. 根據(jù)權(quán)利要求16所述的方法,其中,所述元數(shù)據(jù)段包括: 元數(shù)據(jù)段報(bào)頭; 在所述元數(shù)據(jù)段報(bào)頭之后的至少一個(gè)保護(hù)值,用于所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié) 構(gòu)元數(shù)據(jù)或與所述節(jié)目信息元數(shù)據(jù)和所述子流結(jié)構(gòu)元數(shù)據(jù)相對(duì)應(yīng)的所述音頻數(shù)據(jù)中至少 之一的解密、認(rèn)證或驗(yàn)證中的至少一個(gè);以及 在所述元數(shù)據(jù)段報(bào)頭之后的,包括所述節(jié)目信息元數(shù)據(jù)的所述至少一部分和所述子流 結(jié)構(gòu)元數(shù)據(jù)的所述至少一部分的元數(shù)據(jù)有效載荷。
21. 根據(jù)權(quán)利要求16所述的方法,其中,所述編碼音頻比特流為AC-3比特流或E-AC-3 比特流。
22. 根據(jù)權(quán)利要求16所述的方法,還包括步驟: 使用從所述編碼音頻比特流中提取的所述節(jié)目信息元數(shù)據(jù)或所述子流結(jié)構(gòu)元數(shù)據(jù)中 至少之一,對(duì)所述音頻數(shù)據(jù)執(zhí)行自適應(yīng)處理。
【文檔編號(hào)】G10L19/005GK104240709SQ201310329128
【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2013年7月31日 優(yōu)先權(quán)日:2013年6月19日
【發(fā)明者】杰弗里·里德米勒, 邁克爾·沃德 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1