天中图库/天中图库好运彩/3d天中图库/天中图库胆码

设有两个相邻的数据样本x1战x2

[点击量:][更新时间:2019-09-19]

即压缩领会数据压缩的三个环节目标,控制数据压缩的主要意义控制数据压缩的主要意义控制数据冗余的概念、 分类及消息熵的控制数据冗余的概念、 分类及消息熵的计较公式计较公式领会数据压缩的三个环节目标,即压缩比、 图像质量、 压缩息争压缩的速度比、 图像质量、 压缩息争压缩的速度控制控制HuffmanHuffman编码道理、 方式及特点编码道理、 方式及特点领会预测编码和变换编码道理领会预测编码和变换编码道理熟知音频压缩尺度熟知音频压缩尺度控制图像压缩尺度控制图像压缩尺度JPEGJPEG和和MPEGMPEG讲授方针讲授方针 2.1 2.1 大都据压缩基...

控制数据压缩的主要意义控制数据压缩的主要意义控制数据冗余的概念、 分类及消息熵的控制数据冗余的概念、 分类及消息熵的计较公式计较公式领会数据压缩的三个环节目标, 即压缩领会数据压缩的三个环节目标, 即压缩比、 图像质量、 压缩息争压缩的速度比、 图像质量、 压缩息争压缩的速度控制控制HuffmanHuffman编码道理、 方式及特点编码道理、 方式及特点领会预测编码和变换编码道理领会预测编码和变换编码道理熟知音频压缩尺度熟知音频压缩尺度控制图像压缩尺度控制图像压缩尺度JPEGJPEG和和MPEGMPEG讲授方针讲授方针 2.1 2.1 大都据压缩根基道理大都据压缩根基道理2.2 2.2 数据压缩取解压缩常用算法数据压缩取解压缩常用算法2.3 2.3 大都据常用压缩尺度大都据常用压缩尺度内容内容 2.1 2.1 大都据压缩根基道理大都据压缩根基道理2.1.1 2.1.1 大都据压缩的需要性和可能性大都据压缩的需要性和可能性2.1.2 2.1.2 数据冗余的根基概念取品种数据冗余的根基概念取品种2.1.3 2.1.3 图像压缩预处置手艺图像压缩预处置手艺2.1.4 2.1.4 量化及其质量量化及其质量2.1.5 2.1.5 数据压缩算法分析评价目标数据压缩算法分析评价目标 一幅一幅640激光唱盘激光唱盘CD为1616位, 双通道立体声, 则位, 双通道立体声, 则1 1秒的音频数据量为176.4KB176.4KB, 一个, 一个650MB650MB的光盘仅能存储不脚的光盘仅能存储不脚60的音频数据。的音频数据。640× × 480640× × 480数据率为23MB/sROM光盘只能存光盘只能存29s480中等分辩率的实彩色位图图像中等分辩率的线MB,若以的帧频播放, ,数据率为23MB/s, 用容量为CDCD- -ROM29s的的PAL的数据量为的数据量为 640的帧频播放若以25650MB的60分钟25幅幅/s /s的分钟, 用容量为650MBPAL制式数据。制式数据。21多消息数据庞大是多计较机系统所面多消息数据庞大是多计较机系统所面对的最题之一。 正在各类消息中临的最题之一。 正在各类消息中, ,视频消息数据量最大数据量最大, ,其次是音频信号, 因而, 为了处置和其次是音频信号, 因而, 为了处置和传输多消息不只需要很大的存储容量传输多消息不只需要很大的存储容量, ,并且要有很高的传输速度有很高的传输速度. .视频消息并且要CD的采样频次为的采样频次为44.1kHz44.1kHz, 量化位数, 量化位数秒的音频数据量为为2.1.1 2.1.1 大都据压缩的需要性和可能性大都据压缩的需要性和可能性数据压缩的需要性数据量大数据量大 消息的冗余度消息的冗余度 如空间冗余、 时间冗余、 消息如空间冗余、 时间冗余、 消息熵冗余、 布局冗余、 学问冗余等。熵冗余、 布局冗余、 学问冗余等。人的视觉、 听觉特征人的视觉、 听觉特征2 21音频信号和视频图像的数字化数据可音频信号和视频图像的数字化数据能够进行数据压缩是基于以下两种现实:以进行数据压缩是基于以下两种现实:数据压缩的可能性数据压缩的可能性因而, 完全能够操纵这些特征去除一些多余因而, 完全能够操纵这些特征去除一些多余及不的消息, 从而实现对数据的压缩。及不的消息, 从而实现对数据的压缩。人的听觉特征表示出对部门音频信号不人的听觉特征表示出对部门音频信号不, ,如的听觉具有一个的听觉具有一个强音强音能能一个同时存正在的并且并且, , 人耳对人耳对低频低频端比力端比力, 而对高频端不太。如人人现象, ,一个同时存正在的弱音, 而对高频端不太。弱音现象人的视觉特征表示为对人的视觉特征表示为对亮度缘的急剧变化不;缘的急剧变化不;亮度消息很消息很而对边而对边 2.1.2 2.1.2 数据冗余的根基概念取品种数据冗余的根基概念取品种数据冗余的根基概念数据冗余的根基概念数据冗余数据冗余 消息存正在的各类多余度消息存正在的各类多余度若是用若是用I I、 、 D D、 、 du量和冗余量, 则它们之间的关系可由下式给量和冗余量, 则它们之间的关系可由下式给出出I=D I=D - - dududu别离暗示消息量、 数据别离暗示消息量、 数据 消息量消息量一个事务所需要的消息怀抱和含量一个事务所需要的消息怀抱和含量。 。指从指从N N个相等的可件当选出个相等的可件当选出I I( (x x) )= log= log2 2N= N= - - loglog2 2= = - - loglog2 2p(x)p(x)1 1N N消息熵消息熵信源所有可件的消息量的平均值信源所有可件的消息量的平均值H(xH(x) = H(p(x) = H(p(x1 1),(p(xn n),(p(x2 2), ), , ,p(xp(xn n)) ))= = - - p(xi=1i=1为数据或码元的个数, p p(为码元x x i i 发生的概率。发生的概率。p(xi i) ) × × loglog2 2p(xp(xi i) )式中,式中, n n为数据或码元的个数,为码元(x x i i ) ) 为使单元数据量D接近或等于H, 应设此中b(x 理论环境下, 应取i) 为分派给码元x i 的比特数。但现实上很难确定各码元的概率, 因而,但现实上很难确定各码元的概率, 因而,一般总取一般总取 b b((x x1 1) ) = b= b((x x2 2) ) = ...= b分派给每个码元的比特数相等分派给每个码元的比特数相等( (等长码所得的所得的D D必然大于必然大于H,H,从而构成了消息冗余。从而构成了消息冗余。= ...= b(等长码), ),如许(x x n n) ) , ,即如许即 数据冗余的类别数据冗余的类别这是图像数据中经常存正在的这是图像数据中经常存正在的一种冗余。 正在统一幅图像中,一种冗余。 正在统一幅图像中,法则物体和法则布景的概况法则物体和法则布景的概况物理特征具有相关性, 这些物理特征具有相关性, 这些相关的光成像布局正在数字化相关的光成像布局正在数字化图像中就表示为数据冗余。图像中就表示为数据冗余。1 1空间冗余空间冗余 这是序列图像和语音数据中所经常包这是序列图像和语音数据中所经常包含的冗余。含的冗余。 序列图像一般是位于一时间轴序列图像一般是位于一时间轴区间的一组持续画面, 前后帧之间具有很区间的一组持续画面, 前后帧之间具有很强的相关性。 当播放该图象序列时, 跟着强的相关性。 当播放该图象序列时, 跟着时间的推移, 若干帧画面的某些处所发生时间的推移, 若干帧画面的某些处所发生了变化, 但有的部位却没有变化, 这就形了变化, 但有的部位却没有变化, 这就构成了时间冗余。成了时间冗余。2 2时间冗余时间冗余 3 3布局冗余布局冗余有些图像的纹理区,图像的像素值存正在着较着的分布模式,如方格状的地板图案等,我们称之为布局冗余 。 消息熵冗余是指数据所照顾的消息量少于消息熵冗余是指数据所照顾的消息量少于数据本身所反映出来的数据数据本身所反映出来的数据冗余。冗余。例如例如 若信号{若信号{ a a1 1, , a a2 2} 的概率别离为P(aP(a1 1)=0.9, P(a)=0.9, P(a2 2)=0.1,则信号的平均消息量为则信号的平均消息量为H(xH(x)=)=- - (0.9(0.9× × loglog2 20.9+0.10.9+0.1× × log用二进制数据暗示这两个信号时需用用二进制数据暗示这两个信号时需用1bit明显呈现了明显呈现了数据数据冗余。冗余。} 的概率别离为)=0.1,log2 20.1)=0.467(bit)0.1)=0.467(bit)1bit4 4消息熵冗余消息熵冗余 5 5视觉冗余视觉冗余人类的视觉系统因为受心理特征的人类的视觉系统因为受心理特征的, 对于图像场的任何变化并不是都能, 对于图像场的任何变化并不是都能。 例如, 对图像的压缩或量化而引入的噪。 例如, 对图像的压缩或量化而引入的噪声能使图像发生一些变化, 若是这些变化声能使图像发生一些变化, 若是这些变化并不克不及被视觉所, 则忽略这些变化后并不克不及被视觉所, 则忽略这些变化后, 仍认为图像是无缺的。 现实上, 人的视, 仍认为图像是无缺的。 现实上, 人的视觉系同一般的分辩能力约为觉系同一般的分辩能力约为2 26 6灰度品级,而图像量化一般采用而图像量化一般采用2 28 8灰度品级, 如许的冗余就称为视觉冗余。冗余就称为视觉冗余。灰度品级,灰度品级, 如许的 6 6学问冗余学问冗余又如又如等等, ,这些纪律的布局可由先验学问和布景学问得这些纪律的布局可由先验学问和布景学问获得到。 。我们能够构制其根基模子, 并建立对应各类特征我们能够构制其根基模子, 并建立对应各类特征的图像库, 进而图像的存储只需要保留一些特征参的图像库, 进而图像的存储只需要保留一些特征参数, 就能够大大削减数据量。数, 就能够大大削减数据量。建建物的门和窗的外形、 、 大小比例建建物的门和窗的外形、 、 大小比例由图像记实体例取人对图像的学问之由图像记实体例取人对图像的学问之间的差别所发生的冗余称为学问冗余。间的差别所发生的冗余称为学问冗余。例如例如人脸的图像就有固定的布局, 鼻子位于脸的人脸的图像就有固定的布局, 鼻子位于脸的中线上, 上方是眼睛, 下方是嘴等中线上, 上方是眼睛, 下方是嘴等 7 7其他冗余其他冗余如图像的空间非定常特征所带来的冗余。如图像的空间非定常特征所带来的冗余。别的, 空间冗余和时间冗余是将信号看别的, 空间冗余和时间冗余是将信号看做概率信号时所反映出的统计特征, 因而做概率信号时所反映出的统计特征, 因而有时也称这两种冗余为统计冗余。有时也称这两种冗余为统计冗余。 2.1.3 2.1.3 图像压缩预处置手艺图像压缩预处置手艺图像数据压缩的使命是正在不影响或少图像数据压缩的使命是正在不影响或少影响图像质量的前提下, 尽量设法削减图影响图像质量的前提下, 尽量设法削减图像数据中的数据量。像数据中的数据量。图像数据中存正在各类冗余, 数据压缩的首图像数据中存正在各类冗余, 数据压缩的首要使命就是去除各类冗余数据。 当然删除冗余要使命就是去除各类冗余数据。 当然删除冗余数据必然会给图像质量带来必然的丧失, 这就数据必然会给图像质量带来必然的丧失, 这就需要进行响应的预处置, 来将这种丧失降需要进行响应的预处置, 来将这种丧失降至最低限度。至最低限度。 图像预处置的手艺次要有以下几种:图像预处置的手艺次要有以下几种:二次抽样滤波器滤波度量化量化预测编码预测编码活动弥补活动弥补变长码变长码图像内插法图像内插法二次抽样 2.1.4 2.1.4 量化及其质量量化及其质量量化的概念取道理量化的概念取道理量化量化是将具有持续幅度值的输入信号转换是将具有持续幅度值的输入信号转换为只具有无限个幅度值的输出信号的过程。为只具有无限个幅度值的输出信号的过程。就一般而言, 量化是模仿信号到数字信号就一般而言, 量化是模仿信号到数字信号的映照。 模仿信号是持续量, 而数字信号是离的映照。 模仿信号是持续量, 而数字信号是离散量, 因而量化过程现实上就是用无限的离散散量, 因而量化过程现实上就是用无限的离散量取代无限的持续量的多对一的映照过程。量取代无限的持续量的多对一的映照过程。 一般的一般的量化过程量化过程是事后设置一组判决电是事后设置一组判决电安然平静取其对应的一组码字, 再将整个无效安然平静取其对应的一组码字, 再将整个无效值区间划分成若干个子区间(也即量化级值区间划分成若干个子区间(也即量化级) , 每个子区间对应一个判决电平。 量化) , 每个子区间对应一个判决电平。 量化时将模仿量的采样值取这些判决电平比力时将模仿量的采样值取这些判决电平比力, 若采样值幅度落正在某一子区间上, 则将, 若采样值幅度落正在某一子区间上, 则将它量化为该量化级对应的码字。它量化为该量化级对应的码字。 量化的方式量化的方式正在量化器中从输入信号正在量化器中从输入信号x x到输出信号过程能够暗示为过程能够暗示为y = y = Q(xQ(x) = ) = y yi i到输出信号y y的的( (x x A A) )AiAi: {: {x xi i x x x xi+ i+1 1} (} (i i=1,2,=1,2,N N) )式中,式中, x xi i为判决电平,为判决电平, y yi i为输出电平,为量化器的量化级数。为量化器的量化级数。为输出电平, N N 量化器输出幅度取输入幅度之差, 称量化器输出幅度取输入幅度之差, 称为量化误差, 其均方误差值为为量化误差, 其均方误差值为e=E{[x-Q(x)]2}=2 x xi ii i=1=1x xi+ i+1 1( (x x--y yi i) )2 2p p( (x x) )dxdxN N式中,式中, p p( (x x) 布密度。布密度。) 为量化器输入信号为量化器输入信号x x的概率分的概率分 量化的方式凡是有标量量化和矢量量化量化的方式凡是有标量量化和矢量量化1 1标量量化标量量化标量量化是对颠末映照变换后的数据或标量量化是对颠末映照变换后的数据或PCMPCM数据逐一进行量化, 正在这种量化中,数据逐一进行量化, 正在这种量化中,所有采样利用统一个量化器进行量化, 每个所有采样利用统一个量化器进行量化, 每个采样的量化都取其他采样无关, 故也称为零采样的量化都取其他采样无关, 故也称为零回忆量化。回忆量化。标量量化又有平均量化、 非均标量量化又有平均量化、 非平均量化和自顺应量化之分匀量化和自顺应量化之分. . WW3 3(c)(a) (b)灰度差灰度差WW1 1WW2 2WW3 3WW4 4WW5 5WW6 6WW7 7WW8 8WW1 1WW2 2WW4 4WW5 5WW6 6WW7 7WW8 8点数点数(--255255~~255255)图图2.1 2.1 量化过程示企图量化过程示企图 此中, (此中, ( a a) 图是待量化的函数, 是一) 图是待量化的函数, 是一幅图像的灰度差值曲方图。 其灰度范畴为0 0幅图像的灰度差值曲方图。 其灰度范畴为255, 灰度差的范畴为, 灰度差的范畴为﹣ ﹣ 255log2 2512=9512=9位暗示一个输入。 当限制输出量位暗示一个输入。 当限制输出量化级为8 8时, 量化输出用时, 量化输出用log~~255255~~255255, 需要, 需要log化级为log2 28=38=3位即可位即可 ( ( b b) 图给出了 平均量化处置的示意,) 图给出了 平均量化处置的示意,W1 1~~WW8 8为为8 8个等宽的量化箱, 其宽度总个等宽的量化箱, 其宽度总和等于输入的动态范畴-和等于输入的动态范畴-255应地划分成应地划分成8 8个不异的区间, 每个区间对个不异的区间, 每个区间对应一个量化箱。 第应一个量化箱。 第k k个区间内的核心函数个区间内的核心函数值对应第值对应第k k个量化箱的量化值, 其量化级个量化箱的量化值, 其量化级定义为定义为“ “k k” ”级, 该区间内的所有输入均被级, 该区间内的所有输入均被定义为定义为“ “k k” ”级。级。W255~~255255也相也相 (c) (c) 图给出了 非平均量化处置的示图给出了 非平均量化处置的示意, 这时的量化箱不等宽, 两头大要意, 这时的量化箱不等宽, 两头大要率处箱窄, 两边小概率处箱宽。 同样率处箱窄, 两边小概率处箱宽。 同样量化为量化为8 8级, 但非平均量化的误差小于级, 但非平均量化的误差小于平均量化误差。平均量化误差。 标量量化的量化特征采用阶梯形函数的标量量化的量化特征采用阶梯形函数的形式。 图形式。 图2.22.2给出了 几种平均量化器的量化特给出了 几种平均量化器的量化特征性图图2.2 2.2 平均量化特征平均量化特征xiy yi iy yi i+1+1y yx xxi+1y yx xy yx x死区死区( ( a a) 中平型) 中平型( ( b b) 中升型) 中升型( (c c) 具有死区的中平型) 具有死区的中平型 ) 1,, 2 , 11Niyyii() 1,, 2 , 11Nixxii(图中量化器的特征都是对称的, 且图中量化器的特征都是对称的, 且式中式中 称为量化台阶。称为量化台阶。不难看出, 平均量化器适合于输入信号的统不难看出, 平均量化器适合于输入信号的统计特征(概率分布密度函数计特征(概率分布密度函数P P( ( x x) ) 平均分布的环境。的环境。) ) 平均分布 y图图2.3 2.3 非平均量化特征非平均量化特征x当输入信号的概率分布密度函数分布当输入信号的概率分布密度函数分布不服均时, 最佳的量化器应是一个非均不服均时, 最佳的量化器应是一个非平均量化器。匀量化器。图图2.32.3给出了 一个非平均量化特征的给出了 一个非平均量化特征的例子。例子。 2 2矢量量化矢量量化这是近年来成长起来的一种新的编码这是近年来成长起来的一种新的编码方式, ,是一种的编码方案是一种的编码方案, ,其次要思惟是先将输入的语音信号按必然体例分组是先将输入的语音信号按必然体例分组, ,再把这些分组数据当作一个矢量把这些分组数据当作一个矢量, ,对它进行量化。 每组构成的矢量当作一个元素化。 每组构成的矢量当作一个元素, ,又叫码字字, ,这些码字陈列起来这些码字陈列起来, ,就形成了 一个表表表), ),如许正在领受端放置同样的码表如许正在领受端放置同样的码表, ,当领受到码字的下标消息后到码字的下标消息后, ,就能够通过查表的到码字消息。码字消息。方式其次要思惟再对它进行量又叫码就形成了 一个表( (码码当领受就能够通过查表的到 输入矢量输入矢量搜刮器搜刮器码本码本Y Y传送矢量传送矢量下标下标i i查表查表码本码本Y Y编码编码解码解码i i输入矢量输入矢量图图2.5 2.5 矢量量化编码解码框图矢量量化编码解码框图输入量是一个待编码的矢量输入量是一个待编码的矢量x xi i( (i i=1, 2, 将图像朋分成将图像朋分成m m个方块, 此中任一方块个方块, 此中任一方块i i的大小为k=nk=n2 2) , 以行) , 以行( (或列或列) )便可堆叠成便可堆叠成k k维矢量x xik ik) 。 码本) 。 码本Y:Y:( ( y y1 1, y, y2 2, , , 际上是一个长度为际上是一个长度为N N的表, 表中任一分量的表, 表中任一分量y yi i是一个矢量, 称为码字。矢量, 称为码字。=1, 2, , m), m), 即先, 即先的大小为k k( (维矢量x xi i: :( ( x xi1 i1, x, y yN N) 是一个码字调集, 它实) 是一个码字调集, 它实, xi2 i2, , , , 是一个k k维维 矢量量化编码过程就是从码字调集当选矢量量化编码过程就是从码字调集当选出最慎密适配于输入矢量出最慎密适配于输入矢量x xi i的一个码字过程。 正在码本中找到取输入矢量过程。 正在码本中找到取输入矢量x xi i完全分歧的码字致的码字y yi i的概率很小, 但只需两者之间的概率很小, 但只需两者之间的误差最小时, 便可用该码字的误差最小时, 便可用该码字y yi i来代表输入矢量入矢量x xi i。 传输时并不传送码字。 传输时并不传送码字y yi i本身, 而只传送其下标号只传送其下标号“ “i i” ”。 当码本长度为。 当码本长度为N N时,传送下标所需的比特数为传送下标所需的比特数为log一个像素所需的平均比特数为一个像素所需的平均比特数为( ( 1 1/k /k) ) loglog2 2N N。 。的一个码字y yi i的完全一的来代表输本身, 而时,log2 2N N。 于是传送。 于是传送 此方式以输入矢量取选出的码字之此方式以输入矢量取选出的码字之间失实最小为根据, 取标量量化比拟,间失实最小为根据, 取标量量化比拟,它有更大的数据压缩比。 但其环节问题它有更大的数据压缩比。 但其环节问题是设想一个优良的码本。是设想一个优良的码本。 2.1.5 2.1.5 数据压缩算法的分析评价目标数据压缩算法的分析评价目标数据压缩方式的好坏次要由所能达到数据压缩方式的好坏次要由所能达到的压缩倍数、 从压缩后的数据所能恢复的压缩倍数、 从压缩后的数据所能恢复(或称沉建) 的图像(或声音) 质量、(或称沉建) 的图像(或声音) 质量、以及压缩息争压缩的速度等几方面来评以及压缩息争压缩的速度等几方面来评价。 此外, 算法的复杂性和延时等也是价。 此外, 算法的复杂性和延时等也是该当考虑的要素。该当考虑的要素。 压缩的倍数压缩的倍数压缩的倍数也称压缩率, 凡是有两压缩的倍数也称压缩率, 凡是有两种权衡的方式:种权衡的方式:1 1由压缩前取压缩后的总的数据量之比来暗示由压缩前取压缩后的总的数据量之比来暗示例如, 一幅例如, 一幅1024白图像, 每像素具有白图像, 每像素具有8bit低为低为512512× × 384384, 又经数据压缩使每个像素平, 又经数据压缩使每个像素平均仅用均仅用0.5bit0.5bit, 则压缩倍数为, 则压缩倍数为64缩率为缩率为1:641:64。 。1024× × 7688bit, 通过使其分辩率降, 通过使其分辩率降768像素点构成的黑像素点构成的黑64倍, 或称其压倍, 或称其压 2 2将任何非压缩算法发生的结果(如降将任何非压缩算法发生的结果(如降低分辩率、 帧率等) 解除正在外, 用压缩后低分辩率、 帧率等) 解除正在外, 用压缩后的比特流中每个显示像素的平均比特数的比特流中每个显示像素的平均比特数bpdpbpdp( ( bit per displayed pixelbit per displayed pixel) 来暗示) 来暗示例如, 以例如, 以15000像, 则压缩率为像, 则压缩率为15000字节存储一幅字节存储一幅256256× × 240240的图的图( ( 1500015000× × 8 8) ) / /( ( 256256× × 240240) ) =2=2比特比特/ /像素像素 图像质量图像质量图像质量评估法常采用图像质量评估法常采用客不雅评估评估两种方式。两种方式。客不雅评估和和客不雅客不雅评估客不雅评估客不雅评估数据压缩成果的评估方式数据压缩成果的评估方式是通过一种具体的算法来统计多是通过一种具体的算法来统计多1 1具体做法是: 由若干人对所不雅测的沉建图像具体做法是: 由若干人对所不雅测的沉建图像的质量按的质量按很好很好、 、 好好、 、 尚可尚可、 、 欠好分, 然后计较出平均分数分, 然后计较出平均分数MOS欠好、 、 坏MOS坏五个品级评五个品级评 2 2客不雅评估是通过一种具体的算法来统计大都据压缩成果的评估方式凡是利用信噪比SNR来评价, 其计较方式是和别离是输入图像的均方差取输出图像的均方差。 压缩息争压缩的速度是压缩系统的压缩息争压缩的速度是压缩系统的两项主要的机能目标。两项主要的机能目标。压缩息争压缩的速度压缩息争压缩的速度1 1对称压缩对称压缩: 正在有些使用中, 压缩息争压缩: 正在有些使用中, 压缩息争压缩都需要及时进行, 这称为对称压缩, 如电视会都需要及时进行, 这称为对称压缩, 如电视会议的图像传输。议的图像传输。2 2非对称压缩非对称压缩。 正在有些使用中只需求解压。 正在有些使用中只需求解压缩是及时的, 而压缩能够非及时的, 这称为缩是及时的, 而压缩能够非及时的, 这称为非对称压缩, 如多非对称压缩, 如多CDCD- -ROM就采用非对称压缩。就采用非对称压缩。ROM节目标制做节目标制做 3 3压缩的计较量压缩的计较量: 数据的压缩息争压缩: 数据的压缩息争压缩都需大量的计较。都需大量的计较。凡是压缩的计较量比解压缩的计较量大。 如凡是压缩的计较量比解压缩的计较量大。 如MPEGMPEG的压缩编码计较量约为解码的的压缩编码计较量约为解码的4 4倍。 正在MPEGMPEG中程度标的目的的像素中程度标的目的的像素768的像素的像素576576。 对于。 对于352352× × 240个个8 8× × 8 8的图像块, 计较如许一幅图像的的图像块, 计较如许一幅图像的DCT需需0次乘法运算和次乘法运算和0次加法运算。 及时计较计较3030帧帧/ /秒的口角图像, 仅秒的口角图像, 仅DCT于一帧图的计较量。 若是处置彩色数字电视时,于一帧图的计较量。 若是处置彩色数字电视时,运算次数还要多。运算次数还要多。倍。 正在, 垂曲标的目的768, 垂曲标的目的240的图像, 就有的图像, 就有13201320变换DCT变换次加法运算。 及时DCT变换就需要数倍变换就需要数倍 2.2 2.2 数据压缩取解压缩常用算法数据压缩取解压缩常用算法2.2.1 2.2.1 数据压缩方式的分类数据压缩方式的分类2.2.2 2.2.2 哈夫曼编码哈夫曼编码2.2.3 2.2.3 预测编码预测编码2.2.4 2.2.4 变换编码变换编码 2.2.1 2.2.1 数据压缩方式的分类数据压缩方式的分类数据压缩现实上是一个编码过程, 即将原始数数据压缩现实上是一个编码过程, 即将原始数据进行编码压缩。 数据解压缩是数据压缩的逆过程据进行编码压缩。 数据解压缩是数据压缩的逆过程, 即将压缩的编码还原为原始数据。 因而, 数据压, 即将压缩的编码还原为原始数据。 因而, 数据压缩方式也称编码方式。 自从缩方式也称编码方式。 自从1948编码调制(编码调制( PCMPCM) 编码理论以来, 编码方式的研) 编码理论以来, 编码方式的研1948年年OliverOliver提出脉冲提出脉冲究取得了 极大的成长, 数据压缩手艺已日臻成熟,究取得了 极大的成长, 数据压缩手艺已日臻成熟,适合各类使用场所的编码方式不竭发生。 目前采用适合各类使用场所的编码方式不竭发生。 目前采用的数据压缩方式按起点分歧会有几种分歧的分类的数据压缩方式按起点分歧会有几种分歧的分类成果。成果。 按照压缩方式能否发生失实分类按照压缩方式能否发生失实分类无损压缩是指压缩后的数据经解压缩还原后, 获得的数据取原始数据完全不异。压缩是指压缩后的数据经解压缩还原后, 获得的数据取原数据不完全不异。 按照压缩方式的道理分类按照压缩方式的道理分类1 1预测编码预测编码它是针对空间冗余和时间冗余的压缩方式。它是针对空间冗余和时间冗余的压缩方式。其根基思惟是操纵已被编码的点的数据值来预测其根基思惟是操纵已被编码的点的数据值来预测临近的一像素点的数据值。 预测是按照某一模子临近的一像素点的数据值。 预测是按照某一模子进行的, 若是模子拔取得脚够好的话, 则只需存进行的, 若是模子拔取得脚够好的话, 则只需存储和传输起始像素和模子参数就能够取代整幅图储和传输起始像素和模子参数就能够取代整幅图像了 。 按照模子的分歧, 预测编码又分为线性预像了 。 按照模子的分歧, 预测编码又分为线性预测、 帧内预测和帧间预测。测、 帧内预测和帧间预测。 2 2变换编码变换编码它也是针对空间冗余和时间冗余的压缩方它也是针对空间冗余和时间冗余的压缩方式。 其根基思惟是将图像的光强矩阵(时域信法。 其根基思惟是将图像的光强矩阵(时域信号) 变换到系数空间(频域信号) 上, 然后对号) 变换到系数空间(频域信号) 上, 然后对系数进行编码压缩。 正在空间上具有强相关的信系数进行编码压缩。 正在空间上具有强相关的信号, 反映正在频域上是某些特定区域内的能量常号, 反映正在频域上是某些特定区域内的能量常常被集中正在一路, 或者是系数矩阵的分布具有常被集中正在一路, 或者是系数矩阵的分布具有某些纪律。 能够操纵这些纪律来分派频域上的某些纪律。 能够操纵这些纪律来分派频域上的量化比特数, 从而达到压缩的目标。量化比特数, 从而达到压缩的目标。 3 3子带编码子带编码又称分频带编码。 其根基思惟是将图像数又称分频带编码。 其根基思惟是将图像数据变换到频域后, 按频次分带, 然后用分歧的据变换到频域后, 按频次分带, 然后用分歧的量化器进行量化, 达到最优的组合。 言语和图量化器进行量化, 达到最优的组合。 言语和图像消息都有较宽的频带, 消息的能量集中正在低像消息都有较宽的频带, 消息的能量集中正在低频区域, 细节和边缘则集中正在高频区域。 子带频区域, 细节和边缘则集中正在高频区域。 子带编码采纳保留低频系数舍去高频系数的方式进编码采纳保留低频系数舍去高频系数的方式进行编码, 操做时对低频区域取较多的比特数来行编码, 操做时对低频区域取较多的比特数来编码, 以边缘细节来换取比特数的下降,编码, 以边缘细节来换取比特数的下降,恢复后的图像比原图恍惚。 其特点是有较高的恢复后的图像比原图恍惚。 其特点是有较高的压缩比和信噪比。压缩比和信噪比。 4 4消息熵编码消息熵编码按照消息熵道理, 对呈现概率大的符号用按照消息熵道理, 对呈现概率大的符号用短码字暗示, 反之用长码字暗示。 其目标是短码字暗示, 反之用长码字暗示。 其目标是削减符号序列中的冗余度, 提高符号的平均削减符号序列中的冗余度, 提高符号的平均消息量。 它按照符号序列的统计特征, 寻找消息量。 它按照符号序列的统计特征, 寻找某种方式把符号序列变换为最短的码字序列某种方式把符号序列变换为最短的码字序列, 使各码元承担的消息量达到最大, 同时保, 使各码元承担的消息量达到最大, 同时无失实地恢复本来的符号序列。 实现这种证无失实地恢复本来的符号序列。 实现这种编码的方式有行程编码方式、 哈夫曼编码方编码的方式有行程编码方式、 哈夫曼编码方式和自顺应二进制算术编码方式。法和自顺应二进制算术编码方式。 5 5统计编码统计编码按照一幅图像像素值的统计环境进行按照一幅图像像素值的统计环境进行编码压缩, 也可先将图像按前述方式压缩编码压缩, 也可先将图像按前述方式压缩, 对所得的值加以统计, 再做压缩。 由此, 对所得的值加以统计, 再做压缩。 由此可知, 统计编码既可零丁利用, 又可用正在可知, 统计编码既可零丁利用, 又可用正在某个算法之后做进一步的压缩。 最常用的某个算法之后做进一步的压缩。 最常用的统计编码方式是哈夫曼编码方式。统计编码方式是哈夫曼编码方式。除了 上述编码方式外, 还有布局编码方除了 上述编码方式外, 还有布局编码方式、 统计编码方式、 基于学问的编码方式等。法、 统计编码方式、 基于学问的编码方式等。 2.2.2 2.2.2 哈夫曼编码哈夫曼编码哈夫曼最佳变字长编码哈夫曼最佳变字长编码: 正在变字长编码中, 对于呈现概率大的: 正在变字长编码中, 对于呈现概率大的消息符号编以短字长的码, 对于概率小的符消息符号编以短字长的码, 对于概率小的符号编以长字长的码。 若是码字长度严酷按所号编以长字长的码。 若是码字长度严酷按所对应符号呈现概率大小逆挨次陈列, 则平均对应符号呈现概率大小逆挨次陈列, 则平均码字长度必然小于其他任何符号挨次陈列方码字长度必然小于其他任何符号挨次陈列体例获得的码字长度。式获得的码字长度。 哈夫曼编码的方式哈夫曼编码的方式连系一个具编制子申明哈夫曼编码的方式步调设有信源符号集{a1, a2, a3, a4, a5,a6, a7}, 各符号对应的呈现频次别离为{0.23,0.21,0.18,0.15,0.13,0.07,0.03}其哈夫曼编码过程如下: 0.440.330.560.230.10a1a2a3a4a5a6a70.230.210.180.150.130.070.00010000信源符号概率Huffman码编码过程0按照的编“1”, 下面的编“0” 下面别离计较码字的平均长度N和信源符号的熵值H 哈夫曼编码的特点哈夫曼编码的特点虽然哈夫曼码是变长的, 编码后的码虽然哈夫曼码是变长的, 编码后的码串中又没有分隔码字的标识符, 但因为它串中又没有分隔码字的标识符, 但因为它的无歧义性, 完万能够准确地恢复出原信的无歧义性, 完万能够准确地恢复出原信源所输出的符号序列来。源所输出的符号序列来。1 1哈夫曼编码方式构制出来的码不是专一的哈夫曼编码方式构制出来的码不是专一的2 2哈夫曼编码码字字长分歧一, 给硬件实现哈夫曼编码码字字长分歧一, 给硬件实现带来必然的坚苦带来必然的坚苦3 3 对分歧的信源, 哈夫曼编码的效率也对分歧的信源, 哈夫曼编码的效率也是分歧的是分歧的4 4对信源进行哈夫曼编码后构成了 一个对信源进行哈夫曼编码后构成了 一个哈夫曼编码表, 若要准确解码必需按照此哈夫曼编码表, 若要准确解码必需按照此表。 于是正在信源存储取传输过程中, 必需表。 于是正在信源存储取传输过程中, 必需起首考虑此表的存储取传输, 故此表也占起首考虑此表的存储取传输, 故此表也拥有必然的比特数。 最好的处理方式是利用有必然的比特数。 最好的处理方式是利用默认的哈夫曼编码表。默认的哈夫曼编码表。5 5 2.2.3 2.2.3 预测编码预测编码预测编码方式是一种特地用于压缩统计冗预测编码方式是一种特地用于压缩统计冗余数据的手艺, 次要是削减数据正在空间和时余数据的手艺, 次要是削减数据正在空间和时间上的相关性。 它按照某一模子操纵以往的间上的相关性。 它按照某一模子操纵以往的样本值对新样本值进行预测, 然后将样本的样本值对新样本值进行预测, 然后将样本的现实值取其预测值相减获得一个误差值, 进现实值取其预测值相减获得一个误差值, 进而对这一误差值进行编码。 若是模子脚够好而对这一误差值进行编码。 若是模子脚够好, 且样本序列正在时间上相关性较强, 则误差, 且样本序列正在时间上相关性较强, 则误差值远远小于现实值值远远小于现实值, ,从而达到了 压缩的目标。从而达到了 压缩的目标。 预测编码方式中典型的有预测编码方式中典型的有DPCMADPCMADPCM方式。方式。DPCM和和差分脉冲调制(差分脉冲调制( DPCMDPCM) 预测) 预测差分脉冲调制(差分脉冲调制( Differential Pulse Code Differential Pulse Code ModulationModulation, 简称, 简称DPCMDPCM) 是降低每个像素所需平均比特数最适用的方式。 对于绝大多所需平均比特数最适用的方式。 对于绝大大都图像来说, 正在局部空间和时间上是高度相数图像来说, 正在局部空间和时间上是高度相关的, 因此能够正在已获得像素的根本上通过关的, 因此能够正在已获得像素的根本上通过对当前像素的预测来削减图像的数据量。对当前像素的预测来削减图像的数据量。) 是降低每个像素 当输入信号预测误差值, 由编码器编成二进制码通过信道发送。 领受端解码获得, 取领受端本身构成的预测值相加, 获得恢复后的进入时,先取相减获得进行量化获得, 量化器对差值。1 1DPCMDPCM道理道理 假设用给出的样本值序列x1 1, x2 2, x3 3,,x n n- -1 1来预测x n n,令预测值为:预测器设想是预测编码系统的焦点, 预测器的复杂程度取线性预测中利用以前的样本数相关, 样本数越多, 预测器越复杂。2 2DPCMDPCM编码编码预测器设想预测器设想 xn的最优估量值是使误差dn的期望值最之值,由均方差定义:小的要使最小,应对 a i求偏导数,并令其为零,就可成立关于a1,a2,,an-1的线性方程组即: 上式中可见, 所有的n-1个a i都可由上述方程组解出拾掇可得式中E{x i x 统计学方式确定j}为x i和x j的协方差, 可由 正在预测编码系统中, 预测误差的量化是正在预测编码系统中, 预测误差的量化是形成图像质量下降的次要缘由, 其表示形形成图像质量下降的次要缘由, 其表示形式有:式有:斜率过载颗粒噪声边缘慌乱伪轮廓 正在预测编码系统中, 形成图像质量下降的另正在预测编码系统中, 形成图像质量下降的另一个次要缘由是由图像传输过程中的误码正在接一个次要缘由是由图像传输过程中的误码正在领受端预测器中惹起的误码。 因为领受端当收端预测器中惹起的误码。 因为领受端当前像素是由前面曾经收到的像素预测而来, 因前像素是由前面曾经收到的像素预测而来, 因此一旦某个像素编码发生误码, 必然惹起误码而一旦某个像素编码发生误码, 必然惹起误码向后面的像素, 形成局部图像的毁伤。 幸向后面的像素, 形成局部图像的毁伤。 幸而这种图像毁伤将跟着取误码像素距离的加大而这种图像毁伤将跟着取误码像素距离的加大而逐步削弱。而逐步削弱。 自顺应差分脉冲调制(自顺应差分脉冲调制( ADPCMADPCM) 预测) 预测DPCMDPCM系统的根本是输入数据为平稳的随机过程,系统的根本是输入数据为平稳的随机过程,如许就能够用固定的参数来设想预测器。 然而, 当输入如许就能够用固定的参数来设想预测器。 然而, 当输入数据并非是所要求的平稳的随机过程时, 或总体上平稳数据并非是所要求的平稳的随机过程时, 或总体上平稳, 但局部不服稳时, 利用固定的参数来设想预测器将是, 但局部不服稳时, 利用固定的参数来设想预测器将是不合理的。 这时可采用自顺应预测编码的方式, 即按期不合理的。 这时可采用自顺应预测编码的方式, 即按期地从头计较协方差矩阵和响应的加权因子, 充实操纵其地从头计较协方差矩阵和响应的加权因子, 充实操纵其统计特征统计特征从头调整预测参数从头调整预测参数, 使预测器跟着输入数据的变化而变化, 从而获得较为抱负的输出。变化而变化, 从而获得较为抱负的输出。, 使预测器跟着输入数据的自顺应预测又可分为线性自顺应预测和非线性自自顺应预测又可分为线性自顺应预测和非线性自顺应预测两种。顺应预测两种。 2.2.4 2.2.4 变换编码变换编码变换编码不是间接对时域图像信变换编码不是间接对时域图像信号编码, 而是起首正在数据压缩前对原号编码, 而是起首正在数据压缩前对原始输入数据做某种正交变换, 把图像始输入数据做某种正交变换, 把图像信号映照变换到别的一个正交相量空信号映照变换到别的一个正交相量空间, 发生一批变换系数, 然后再对这间, 发生一批变换系数, 然后再对这些变换系数进行编码处置。些变换系数进行编码处置。 采用变换编码, 能够大大削减数据采用变换编码, 能够大大削减数据冗余。 例如, 若是有一个正弦波, 我们冗余。 例如, 若是有一个正弦波, 我们用采样、 量化的方式把它变换的时域用采样、 量化的方式把它变换的时域上, 则随时间的增加数据量会海量增上, 则随时间的增加数据量会海量增加。 但换个思一个正弦波只需记实频长。 但换个思一个正弦波只需记实频域上的幅度值以及它的频次, 就完全可域上的幅度值以及它的频次, 就完全能够暗示正弦波了。以暗示正弦波了。 又如, 设有两个相邻的数据样本x1和x2, 每个样本 采用3比特编码, 则各有8个幅度品级, 两个样本的结合事务共有64种可能用下图二维平面坐标暗示。考虑到相邻样值的相关性, x1和x2同时呈现附近幅度的可能性最大。因而,合成可能性往往落正在暗影区内。 若是对数据进行正交变换, 从几何上相当于坐标系扭转 450,变成y1、 y2坐标系,则正在新坐标系下, 任凭y1正在较大的范畴变化, 而y2一直只正在相当小的范畴内变化,因而通过如许的变化就能获得一组去除大部门, 以至是全数统计相关性的另一种输出样本。常用的变换编码有离散傅立叶变换(DFT)、 卡亨南-洛甫变换(KL) 、 离散余弦变换(DCT)等。 2.3 2.3 大都据常用压缩尺度大都据常用压缩尺度2.3.1 2.3.1 音频压缩尺度音频压缩尺度2.3.2 2.3.2 静态图像压缩编码尺度静态图像压缩编码尺度JPEGJPEG2.3.3 2.3.3 数字图像压缩编码尺度数字图像压缩编码尺度MPEGMPEG- -1 12.3.4 2.3.4 通用视频图像压缩编码尺度通用视频图像压缩编码尺度MPEGMPEG- -2 22.3.5 2.3.5 低比特率音低比特率音/ /视频压缩编码尺度视频压缩编码尺度MPEGMPEG- -4 4 2.3.1 2.3.1 音频压缩尺度音频压缩尺度音频压缩方式概述音频压缩方式概述无损压缩无损压缩(熵编码)(熵编码)压缩压缩(熵压缩)(熵压缩)哈夫曼编码哈夫曼编码算术编码算术编码逛程编码逛程编码波形编码波形编码参数编码参数编码夹杂编码夹杂编码PCMPCM (A)(A)DPCMDPCMADPCMADPCMSBSB- -ADPCMADPCMCELPCCELPCVSELPVSELPPREPRE- -LTPMPEGMPEGACAC- -3 3LTP用于公共网用于公共网ISDNISDN配音配音用于保密德律风用于保密德律风用于用于挪动通信挪动通信用于用于语音邮件语音邮件用于用于ISDNISDN用于用于CD用于用于声响CD声响LPCLPC 音频压缩手艺尺度音频压缩手艺尺度1 1德律风质量的音频压缩编码手艺尺度德律风质量的音频压缩编码手艺尺度G.711 G.711 : : 采用非线 : : 采用采用ADPCMADPCM编码, 速度为编码, 速度为32 G.728 G.728 : : 采用基于短时延码本激励线性预测编采用基于短时延码本激励线性预测编码码LDLD- -CELP CELP , 速度为, 速度为16kbit/s 16kbit/s G.729G.729 : : 采用基于共轭布局代数码本激励线性采用基于共轭布局代数码本激励线性预测编码预测编码CSCS- -ACELP ACELP , 速度为, 速度为8kbit/sGSMGSM : : 采用长时延线性预测法则码本激励采用长时延线性预测法则码本激励RPERPE- -LTPLTP 编码, 速度为编码, 速度为13kbit/sCTIACTIA: : 采用矢量和激励线性预测手艺采用矢量和激励线性预测手艺VSELP, 速度为, 速度为8kbit/s 8kbit/s PCM 编码, 数据速度编码, 数据速度32 kbit/skbit/s , ,8kbit/s13kbit/sVSELP 2 2调幅质量的音频压缩编码手艺尺度调幅质量的音频压缩编码手艺尺度G.722G.722: : 采用子带编码 , 数据速度为224kbit/s3 3高保实度立体声音频压缩编码手艺尺度高保实度立体声音频压缩编码手艺尺度MPEGMPEG音频音频: : 采用采用MPEGMPEG- -Audio每声道达每声道达705kbit705kbit/ / s s。 它操纵了 人的听觉心理机。 它操纵了 人的听觉心理机能对输入信号进行快速付里叶变换, 将时间域能对输入信号进行快速付里叶变换, 将时间域采样信号变换到频次域, 然后计较功率谱, 对采样信号变换到频次域, 然后计较功率谱, 对于低于听力阈值的采样值不予编码, 如许大幅于低于听力阈值的采样值不予编码, 如许大幅度压缩数据量。度压缩数据量。ACAC- -3 3: : 采用子带编码, 数据率为采用子带编码, 数据率为320kbit/s ACAC- -3 3尺度凡是合用于数字电视和尺度凡是合用于数字电视和HDTV统的音频数据压缩。统的音频数据压缩。Audio算法, 数据速度算法, 数据速度320kbit/s 。 。HDTV系系 2.3.2 2.3.2 静态图像压缩编码尺度静态图像压缩编码尺度JPEGJPEG静止图像压缩编码尺度静止图像压缩编码尺度JPEG合图像专家组(合图像专家组(Joint Photographic Expert Joint Photographic Expert GroupGroup) 为单帧彩色图像的压缩编码而制定) 为单帧彩色图像的压缩编码而制定的尺度, 图像尺寸能够正在的尺度, 图像尺寸能够正在1 1~~~6553565535像素像素/ /行的范畴内。 采用此尺度可将行的范畴内。 采用此尺度可将每像素每像素2424比特的彩色图像压缩至每像素比特的彩色图像压缩至每像素1 1~比特仍连结很好的质量。比特仍连结很好的质量。JPEG是由是由ISOISO联联~6553565535行行/ /帧,帧, 1 1~2 2 JPEGJPEG确定的图像压缩尺度的方针是:确定的图像压缩尺度的方针是:编码器该当可由用户设置参数, 以便用编码器该当可由用户设置参数, 以便用户正在压缩比和图像质量之间衡量折衷户正在压缩比和图像质量之间衡量折衷尺度可合用肆意类持续色调的数字静止尺度可合用肆意类持续色调的数字静止图像, 不图像的景像内容图像, 不图像的景像内容计较复杂度适中, 只需必然能力的计较复杂度适中, 只需必然能力的CPU就可实现, 而不要求很高档的计较机, 复就可实现, 而不要求很高档的计较机, 复杂的软件本身要易于操做杂的软件本身要易于操做定义了 两种根基压缩编码算法和定义了 两种根基压缩编码算法和4 4种编码模式模式CPU种编码 JPEGJPEG尺度的次要内容尺度的次要内容尺度名称:尺度名称:彩色多灰度持续色调静态图彩色多灰度持续色调静态图像尺度。尺度。采用算法:采用算法:JPEGJPEG采用了夹杂编码方式, 定义了两种采用了夹杂编码方式, 定义了两种根基压缩算法:根基压缩算法:基于基于DCTDCT并使用行程编码和熵编码的并使用行程编码和熵编码的有失实压缩算法失实压缩算法。 。基于空间线性预测手艺(即基于空间线性...


Copyright 2018-2021 天中图库 版权所有 未经授权,严禁转载,违者将被追究法律责任。