[發明專利]靈活量化有效
| 申請號: | 201210297902.7 | 申請日: | 2007-05-04 |
| 公開(公告)號: | CN102833545A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | C·屠;S·斯里尼瓦桑 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/30;H04N7/50 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 楊潔 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 靈活 量化 | ||
本申請是申請日為2008年11月3日,申請號為200780015871.9(國際申請號為PCT/US2007/010848),名為“靈活量化”申請的分案申請。
背景
1.基于塊變換的編碼
變換編碼是在許多音頻、圖像和視頻壓縮系統中使用的一種壓縮技術。未壓縮數字圖像和視頻通常被表示或捕捉為以二維(2D)網格排列的圖像或視頻幀中各位置處的圖元或色彩的樣本。這被稱為圖像或視頻的空間域表示。例如,用于圖像的典型格式由被排列為網格的24位彩色圖元流構成。每一樣本是表示諸如RGB或YIQ等色彩空間內該網格中的一個像素位置處的色彩分量的數字。各種圖像和視頻系統可使用各種不同的色彩、空間和時間分辨率的采樣。類似地,數字音頻通常被表示為時間采樣的音頻信號流。例如,典型的音頻格式由在有規律的時間間隔處所取的16位音頻信號幅度樣本流構成。
未壓縮數字音頻、圖像和視頻信號可消耗大量的存儲和傳輸能力。變換編碼通過將信號的空間域表示變換成頻域(或其它類似的變換域)表示,然后降低該變換域表示的某些一般較不可感知的頻率分量的分辨率,減小了數字音頻、圖像和視頻的大小。這一般與降低空間域中的圖像或視頻或時域中的音頻的色彩或空間分辨率相比,產生了較不可感知的數字信號劣化。
更具體而言,圖1所示的典型的基于塊變換的編解碼器100將未壓縮的數字圖像的像素劃分成固定大小的二維塊(X1,...Xn),每一塊可能與其它塊重疊。對每一塊應用進行空間-頻率分析的線性變換120-121,這將塊內彼此隔開的樣本轉換成一般表示塊間隔上相應的頻帶內的數字信號的強度的一組頻率(或變換)系數。為了壓縮,變換系數可被選擇性地量化130(即,諸如通過丟棄系數值的最低有效位或將較高分辨率數字集中的值映射到較低分辨率來降低分辨率),并且還被熵或可變長度編碼130成壓縮的數據流。在解碼時,變換系數進行反變換170-171以便幾乎重構原始的色彩/空間采樣圖像/視頻信號(重構塊)。
塊變換120-121可被定義為對大小為N的向量x的數學運算。最通常的是,該運算是線性乘法,從而產生變換域輸出y=Mx,M是變換矩陣。當輸入數據是任意長時,它被分段成大小為N的向量,并且向每一段應用塊變換。出于數據壓縮的目的,選擇可逆塊變換。換言之,矩陣M是可逆的。在多個維度中(例如,對于圖像和視頻),塊變換通常被實現為可分操作。沿數據的每一維(即,行和列)可分地應用矩陣乘法。
對于壓縮,變換系數(向量y的分量)可被選擇性地量化(即,諸如通過丟棄系數值的最低有效位或將較高分辨率數字集中的值映射到較低分辨率來降低分辨率),并還可被熵或可變長度編碼為壓縮的數據流。
在解碼器150中解碼時,如圖1所示,在解碼器150側應用這些操作的反過程(反量化/熵解碼160和反塊變換170-171)。在重構數據時,將逆矩陣M-1(反變換170-171)作為乘數應用于變換域數據。當應用于變換域數據時,反變換幾乎重構原始時域或空間域數字媒體。
在許多基于塊變換達到編碼應用中,變換理想地是可逆的以取決于量化因子同時支持有損和無損壓縮兩者。如果例如沒有量化(一般被表示為量化因子1),則利用可逆變換的編解碼器可在解碼時精確地再現輸入數據。然而,這些應用中的可逆性的要求約束了對用于設計編解碼器的變換的選擇。
諸如MPEG和Windows?Media等許多圖像和視頻壓縮系統利用基于離散余弦變換(DCT)的變換。已知DCT具有得到近乎最優的數據壓縮的良好能量壓縮特性。在這些壓縮系統中,在壓縮系統的編碼器和解碼器兩者中的重構環路中采用了反DCT(IDCT)來重構各個圖像塊。
2.量化
根據一個可能的定義,量化是用于通常用于有損壓縮的近似不可逆映射函數的術語,其中有一組指定的可能輸出值,并且該組可能的輸出值中的每一成員具有導致對該特定輸出值的選擇的一組相關聯的輸入值。已經開發了各種量化技術,包括標量或矢量、均勻或非均勻、有或沒有死區、以及自適應或非自適應量化。
量化操作本質上是按照量化參數QP的加偏除法(biased?division),這在編碼器處執行。反量化或乘法操作是與QP的乘法,這在解碼器處執行。這些過程共同引入了原始變換系數數據的丟失,這表現為解碼的圖像中的壓縮誤差或偽像。在最簡單的編解碼器中,可向一幀中的所有變換系數應用特定的固定QP值。盡管這在某些情況下可能是可接受的解決方案,但是它也有幾個缺點:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201210297902.7/2.html,轉載請聲明來源鉆瓜專利網。





