多媒体数据压缩基本原理_会议广播_音频应用论坛 - Powered by AUIOAPP

音频应用论坛

 找回密码
 快速注册

QQ登录

只需一步,快速开始

搜索
热搜: 音频应用

[资讯] 多媒体数据压缩基本原理

[复制链接]
coolhear3d 发表于 2005-9-25 01:09:00

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
2.1.1  多媒体数据压缩的必要性与可能性& P9 @' |% E4 ^8 J0 G0 @1 J7 q
在多媒体计算机系统中,信息从单一媒体转到了多种媒体,要表示、传输和处理大量的声音、图像甚至影像视频信息,其数据量之大是非常惊人的。下面分别以文本、图像、音频、视频等不同类型的信息为例计算一下它们的信息量。3 q' u8 ^5 i, [* U  h
8 }! ?; v6 G& X. I  x0 _! E. z
1) 文本。设屏幕的分辨率为640×480(中等分辨率),字符大小为8×8点阵,每个字符占用两个字节,则满屏字符的数据存储量为:(640/8)×(480/8)×2×8=9600B=76.8kbit。  m3 e& g8 h+ ~" f6 A2 ~
* W' X- k" T& i# p% U
2) 图像。以一幅640×480中等分辨率的伪彩色图像(8bit/像素)来看,则一帧图像的数据存储量为:640×480×8=2457600bit =2.46Mbit;若是同样大小的真彩色图像(24bit/像素),则一帧图像的数据存储量为:640×480×24=7372800bit=7.37Mbit。5 V0 V, _( o9 r' Q

2 i- d4 D9 H: E  M/ x& H3) 音频。先看简单的语音信号,实验表明,人在正常说话时的音频一般在20Hz到4kHz范围,即人类语音带宽为4kHz。依据采样定理,当采样频率不小于两倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。若采样位数取8bit,则1秒的数据存储量为4×2×8=64kbit;如果是高质量音频,采样频率至少为44.1kHz,量化为16bit双通道立体声,则1秒的数据存储量为44.1×16×2=1411.2kbit=1.41Mbit,在600MB的标准光盘中也仅能存放约1小时左右的数据。
; F% U! C- w4 E
  b9 w/ f& X  O5 N4) 视频。以一般彩色电视信号为例,YIQ彩色空间中各分量的带宽分别为4.2MHz、1.5MHz和0.5MHz。设各分量均被数字化为8位,根据采用样定理,则1秒的电视图像信号数据存储量将达到(4.2+1.5+0.5)×2×8=99.2Mbit,即使是存放在600MB的标准光盘中,也仅能播放约40秒。$ T$ ~0 b) _4 \0 z4 \
9 |( H  Y3 o5 M
从以上多媒体信息与数据量的关系可见,数字化多媒体信息的数据量是如此巨大,加之信息种类多、实时性要求高,给数据的存储、传输以及加工处理均带来了巨大的压力,不仅要求计算机有更高的数据处理和数据传输能力以及巨大的存储空间,而且也要求通信信道有更高的带宽。为了解决存储、处理和传输多媒体数据的问题,除了提高计算机本身的性能以及通信信道的带宽外,更重要的则是对多媒体数据进行有效的压缩。因此数据压缩编解码自然就成为了多媒体技术中最为关键的核心技术。
" v+ {+ g  Y$ m5 u; |
* O1 b, D& j8 q& R多媒体数据之所以能进行压缩,首先是因为多媒体数据中存在着很大的冗余,包括空间冗余、时间冗余、信息熵冗余、结构冗余、知识冗余、统计冗余等等。其次,作为多媒体信息的主要接收者,人的视觉和听觉都有其固有的生理特性,如人类视觉有“视觉掩盖效应”,即人对亮度信息很敏感,而对边缘的急剧变化不敏感;同样,听觉也存在类似的生理特性,即人对部分频率的音频信号不敏感。因此,可以利用人类视觉听觉特性,去除一些人的生理特性对其不敏感的信息,从而实现对数据的压缩。
# q# r: U% a* x0 i# ~& S% ~6 U4 L% O- s
2.1.2  数据冗余的基本概念与种类& z/ Q* c. ]) h( N
1. 数据冗余的基本概念9 B3 O2 t8 e( ?. y

+ |' Q4 n7 x: v1 N5 Q多媒体数据,尤其是图像、音频和视频,其数据量是相当大的,但那么大的数据量并不完全等于它们所携带的信息量,换言之,表达它们所携带的信息量并不需要那么大的数据量。在信息论中,这就称为冗余。冗余是指信息存在的各种性质的多余度。例如, 180个汉字,其文本数据量仅为360B,若广播员用一分钟的时间去读它,则对语音直接采样的数据量将达到480KB。这就是说,传递同样的信息,数字化后的语音数据存在着1300多倍的文本数据冗余。
  P* j: h* P0 G- c) ?# X, K% a
  Q: c3 y) s, \7 g' @如果用I、D、du分别表示信息量、数据量和冗余量,则它们之间的关系可由下式给出:
1 e# @1 T. F  f
" o2 w; R9 q; gI=D-du  (2-1) 4 i. n/ h" X1 Q4 B4 M

# D: @; C0 f; H# Z1 }冗余量du反映了数据量D中含有的数据冗余,在数据进行存储之前去除数据冗余是十分必要的。
/ x0 P6 L! ]5 n; \% M2 Z2 G# n3 P4 }# Q) W: k) Y
2. 数据冗余的类别" ^% d! \6 e- n0 x, K+ B6 H* {* [
. x7 k' H5 O; p6 K$ J! k5 ?
多媒体数据在数字化后存在着各种形式的数据冗余,一般来说有以下几种类型:
& E! L6 C4 l+ e" x6 E, w+ b! P0 ?3 l1 {& Y+ K9 Z' v1 g
1)空间冗余:这是图像数据中经常存在的一种数据冗余。在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,所谓规则是指表面颜色分布是有序的而非杂乱无章,这些相关的光成像结构在数字化图像中就表现为数据冗余。例如,一个表面颜色均匀、各部分的亮度、饱和度相近的规则物体的图像,在对其进行数字化处理生成点阵图后,会发现很大数量的相邻像素其数据是完全一样或十分接近的,完全一样的数据当然可以压缩,而十分接近的数据也可以压缩。去掉这部分图像数据并不影响视觉上的图像质量,甚至对图像细节也无多大影响,因为恢复图像后人眼分辨不出它与原图像有什么区别。这种压缩就是对空间冗余的压缩。4 j' O0 ^  k& P% A& V8 j

& n1 e& V, P9 \% l* O; k( i2)时间冗余:这是时基类媒体数据中经常存在的一种数据冗余。譬如,动态图像是由许多帧连续画面的序列构成的,前后帧之间具有很强的相关性,当播放该图像序列时,随着时间的推移,若干帧画面的某些地方发生了变化,但有的部位却根本没有变化,这就形成了时间冗余。具体看一个坐在客厅沙发上说话的人的序列画面,从一帧到下一帧,背景没有发生任何变化,人的绝大部分部位也没有发生变化,仅仅是人的面部略有变化,因此,相邻帧之间存在着很大的数据冗余。同样,语音数据由于前后也有着很强的相关性,它们也经常包含着冗余。
- m$ b# \2 Y+ \8 i; [& u. f  I% W. k( U3 r: ]& d" a' u
3)结构冗余:数字化图像中物体表面纹理等结构往往存在着数据冗余,这种冗余就称为结构冗余。当一幅图像中有很强的结构特性,如布纹图像和草席图像等,其纹理很规范清晰,于是它们在结构上存在着极大的相似性,也就存在着较强的结构冗余。' ]- ~1 T- V# z1 j  \# a
! C) Z! y( o# D- H1 W# y
4)信息熵冗余:信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余。信息熵是指一组数据所携带的信息量,它一般定义为/ A, M0 w: A& Y" R1 z9 U
8 u% w, A8 {4 ?4 |. a" N
                     
4 r, e$ T' {! ^# g3 t- a6 m& a
$ z7 _+ ]& i2 e1 ?" u7 f9 j6 p6 Z (2-2) 2 Y9 P# E  H" G" r
4 z& N, Q% K" h; J5 P1 @8 a: P
式中,n为数据类数或码元的个数,p(xi)为码元xi发生的概率。为使单位数据量D接近或等于H,应设
1 y% s9 R5 m* [: n! t- h8 o" |) m7 [7 D- e! t. Y3 \8 C
(2-3) , t+ B0 }: x( s; G+ g9 |
- D9 y! y3 s' V# r' q. ~
其中b(xi)为分配给码元xi的比特数。理论状态下应取b(xi)= — log2 p(xi),但实际上很难预估出{p(x0), p(x1),…, p(xn -1)}。因此,一般总是取b(x0)= b(x1)=…=b(xn—1),即分配给每个码元xi的比特数相等(或曰等长码)。这样所得的D必然大于H,由此便形成了信息熵冗余或称编码冗余。
9 A' J, r9 s  D& h3 R
0 ]2 A7 V1 q0 j, e  X) F2 U" h5)视觉冗余:人类的视觉系统由于受生理特性的限制,对于图像场的任何变化并不是都能感知。例如,对图像的压缩或量化而引入的噪声能使图像发生一些变化,如果这些变化并不能被视觉所感知,则忽略这些变化后,仍认为图像是完好的。事实上,人的视觉系统一般的分辨能力约为26灰度等级,而图像量化一般采用28灰度等级,这样的冗余就称为视觉冗余。/ E6 O- |1 X" s3 k) i

4 O4 n% R6 s2 Y) G8 H! W6)知识冗余:由图像的记录方式与人对图像的知识之间的差异所产生的冗余称为知识冗余。人对许多图像的理解与人的某些知识有很大的相关性。譬如,人脸的图像就有固定的结构,鼻子位于脸的中线上,上方是眼睛,下方是嘴等;又譬如,建筑物中的门和窗的形状、位置、大小比例等。这些规律性的结构可由先验知识和背景知识得到。人具有这样的知识,但计算机存储图像时却还得一个一个像素地存入,这就形成了知识冗余。0 H  B# c& o$ ]# O$ B8 a; x

1 A- K; ~  p* j( i) z. F$ [) {! ^7)其他冗余:如图像的空间非定常特性所带来的冗余。/ C& O* ?7 S. ^+ N' A7 x9 m! o8 S4 y
. M: V# F, A  P) m& `" o. t
另外,空间冗余和时间冗余是将信号看作概率信号时所反应出的统计特性,因此有时也称这两种冗余为统计冗余。
* |8 D9 g" m7 T, H3 c( L3 R- j  B2 L
2.1.3  图像压缩预处理技术! G2 e2 H' o9 _2 v/ f% [7 m' I9 z
图像数据压缩的任务是在不影响或少影响图像质量的前提下,尽量设法减少图像数据中的数据量。上小节讨论的内容表明图像数据中存在各种冗余,因此数据压缩的首要任务就是去除各种冗余数据。当然删除冗余数据必然会给图像质量带来一定的损失,这就需要进行相应的预处理,来保证将这种损失降至最低限度,因为当删除的是那些人的视觉系统不能察觉的信息时,图像质量的损失也不会被人的视觉系统所察觉。为此,图像压缩技术使用一些通用的预处理工具,如滤波器、色差信息二次抽样、量化、预测编码、运动补偿、变长编码和图像内插等附加的能提供有效压缩因子的图像变换算法。图像预处理的技术主要有以下几种:
* ^- P+ Q+ W7 B/ U
( m) P) P3 y$ v" j1)二次抽样:人的视觉对图像亮度分量的敏感程度高于色差分量,因此,亮度值应以最大的分辨率进行编码,可采用二次抽样或删去一些色差像素值而保留亮度值,使数据减少后的图像质量仅有很小的降低。; x2 I) s9 v4 d; y. s
6 O5 U& w7 k1 h, b, {1 c: i% [- p# Q
2)滤波器:滤波器能有选择地删除、衰减或放大信息。
2 x4 g- O% t, h9 a1 X. F; N% w( O2 N. }# _4 U$ o
3)量化:量化是用整数码来代替采样值的技术,真实值和量化值之差是分辨率和噪声的混合。
5 E* ^  Y# t3 s! M2 f
) Z+ M1 H( a' q4)预测编码:预测编码通过统计冗余来改进压缩。先前解码的像素值(包括解码和编码)可以估计或预测尚未解码的像素值,这只需要对预测值和真实值之间的差值进行编码。这个差值是预测误差,解码器用它来修正预测。7 E% E  ?& I; m5 w: [& l
- k5 ^2 x: P- V/ |5 h6 N* H3 ~
5)运动补偿:运动补偿使用二维图像簇位移矢量来预测图像中邻域像素簇位移值,在新的图像中重新定位像素块。该技术依赖于一个事实,即背景相同的图像序列中,许多物体保持在同样的位置上,有些物体可能移动一段很小的距离。
, f' f" b7 q2 V3 x: P& h& A) l- V1 ]4 ~6 y1 V
6)变长码:变长码是一种统计技术,它的基本思想是出现频率高的值被赋以短码字,出现频率低的值被赋以长码字。平均起来,则使用频率高的短码字起了极大的支配作用,使得新的码串比原来缩短了很多,实现了更有效的压缩传输和存储。
" ~( m, |: Q  e. Q8 U9 K! h9 o" m( g: R; _* W! o: i
7)图像内插法:图像内插法允许产生中间图像,因此邻近的两幅图像可以产生中间像,于是(在某种情况下)可以减少数据传输和存储。
0 [3 f0 @, G3 q8 i
. U6 ~. Z7 x3 R  e+ E+ t2.1.4  量化及其质量( Q, ]- W7 u6 }. w  Z& z
1.量化的概念与原理
, L$ I5 u$ S! t+ \$ J# L6 R
+ \. o. T$ U+ Y量化是将具有连续幅度值的输入信号转换为只具有有限个幅度值的输出信号的过程。在压缩编码中,量化是一个对压缩后的码(比特)率和重建图像质量均产生重要影响的步骤。量化处理是使数据比特率下降的一个强有力的措施。就一般而言,量化是模拟信号到数字信号的映射。模拟信号是连续量,而数字信号是离散量,因此量化过程实际上就是用有限的离散量代替无限的连续量的多对一的映射过程。原始的量化概念来自于模数转换(A/D转换),即通过采样将连续的模拟量离散化,进而对其数字化。一般的量化过程是预先设置一组判决电平和与其对应的一组码字,再将整个有效值区间划分成若干个子区间(也即量化级),每个子区间对应一个判决电平。量化时将模拟量的采样值与这些判决电平比较,若采样值幅度落在某一子区间上,则将它量化为该量化级对应的码字。
0 q: Q8 G+ G0 ]* D/ N) C- K; i5 r- x, b4 p  `
数据压缩编码中的量化处理是指以PCM码作为输入,经正交变换、差分或预测处理后,在熵编码前,对正交变换系数、差值或预测误差的处理。量化输入值的动态范围很大,需要以较多的比特数表示一个数值,而量化输出只能取有限个量化级,以使量化后的数值用较少的比特数便可表示,因而量化处理总是将多个输入量化到一个输出级上。以图像灰度值量化为例,理论上图像灰度值是连续的数值,而我们通常看到的是以0~255的整数表示图像灰度,这就是经A/D变换后的以256级灰度分层量化的灰度值,这样就可以用log2256=8比特来表示一个图像像素的灰度值。
  K+ t/ X! D9 ]1 N1 c1 t: J$ W6 u* i. F
显然,量化过程不可避免地存在量化误差。如何保证量化误差最小是量化器设计过程中的重要问题。
# g: c# _4 ?; ?/ O* M( P; G8 H* K  u6 r
2.量化的方法
! F! n7 ]1 p5 y  e' ~% E, |( v' g2 N* E3 q3 E
在量化器中从输入信号x到输出信号y的过程可以表示为( e: d; t; }% ]2 e& \0 B

0 \3 Q# X6 z2 o& i2 M
' P8 G+ w- w5 E  C7 q* L. R
: r; @6 O+ k* Y; Z
. J& z# \1 y6 R. ]
7 @8 N, y5 W% Y/ n( n6 \4 L! q7 q+ R( M
式中,xi为判决电平,yi为输出电平,N为量化器的量化级数。
, t" M( ~2 }, d$ [- A
( U5 o( i% h4 h量化器输出幅度与输入幅度之差,称为量化误差,其均方误差值为
( M: S# u" k5 `# P7 k- S3 X$ b  d$ Z& p6 l; ^

+ @. D+ E7 M4 o( Q7 [
2 R, K1 q  Y' ]' \  u3 Z; T, U式中,p(x)为量化器输入信号x的概率分布密度。. f, a9 [- ~% E

0 R; m+ V4 {7 C% y$ j量化的方法通常有标量量化和矢量量化。
) F% i& B/ R' R
4 K; Z/ J- X' i% e2 ^# r* N2 V# G4 a(1)标量量化 ( d4 [0 h7 f, z6 \
标量量化是对经过映射变换后的数据或PCM数据逐个进行量化,在这种量化中,所有采样使用同一个量化器进行量化,每个采样的量化都与其他采样无关,故也称为零记忆量化。标量量化又有均匀量化、非均匀量化和自适应量化之分,图2-1给出了一个标量量化过程的示意图。其中,(a)图是待量化的函数,是一幅图像的灰度差值直方图。其灰度范围为0~255,灰度差的范围为﹣255~255,需要log2512=9位表示一个输入。当限定输出量化级为8时,量化输出用log28=3位即可。(b)图给出了均匀量化处理的示意,W1 ~W8为8个等宽的量化箱,其宽度总和等于输入的动态范围-255~255也相应地划分成8个相同的区间,每个区间对应一个量化箱。第k个区间内的中心函数值对应第k个量化箱的量化值,其量化级定义为“k”级,该区间内的所有输入均被定义为“k”级。(c)图给出了非均匀量化处理的示意,这时的量化箱不等宽,中间大概率处箱窄,两边小概率处箱宽。同样量化为8级,但非均匀量化的误差小于均匀量化误差。' w# h/ x" j4 t% c
9 z5 H3 m; G) }$ w* y
标量量化的量化特性采用阶梯形函数的形式。图2-2给出了几种均匀量化器的量化特性,x表示量化输入,y表示量化输出。图中量化器的特性都是对称的,且
" ^: _: |9 D  T% o. E
/ b- ]; j6 H7 B/ c9 C3 [6 I / n, s: Z" o8 l% ~; G( B( w$ n
+ N" o( ?  _( m' Z7 O  J3 o
0 Q' {1 o3 N" @, @' \8 i2 b2 A8 B
( `1 B6 C$ U% B( q6 M5 L; E1 D% T
$ A# `" R7 M& R; \( t: N
式中Δ称为量化台阶。图2-2(a)所示的量化特性称为中平型,而图2-2(b)所示的量化特性称为中升型。两者的区别主要在于输出电平是否包含了零电平。图2-2(c)所示的量化特性称为具有死区的中平型,它与图2-2(a)的区别是其输出零电平所对应的输入电平范围较宽(称为死区),因而有利于数据的压缩。  
6 X# L0 `( o! b# @; Y5 [) L$ ~: Y0 n8 X
不难看出,均匀量化器适合于输入信号的统计特性(概率分布密度函数P(x))均匀分布的情况。当输入信号的概率分布密度函数分布不均匀时,最佳的量化器应是一个非均匀量化器。) `4 x* @8 H* O6 Z2 U
+ m4 \1 f; h5 K) _' q
图2-3给出了一个非均匀量化特性的例子。量化器量化特性的非线性程度可以通过曲线C(x)表示。图2-4给出了动态范围为[﹣xmax,xmax]、级数为N的均匀量化器和非均匀量化器特性之间的对比。当N足够大时,C(x)的斜率近似为两个量化器的量化台阶之比,即/ c$ O' j# ~0 ]2 G# r' D- Y6 g

- I5 x' I0 y5 v, \# d4 A. e  + f& n5 r* }4 d' R, f
+ t1 i0 C7 c- B, a
(2)矢量量化
6 n; A% r; f0 ]6 k! K% I& U! c+ d  a. I% L& S
矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种量化方法,又称分组量化。对PCM数据,若逐个数据量化,则为标量量化,若将这些数据分成组,每组k个数据构成一个k维矢量,然后以矢量为单元逐个进行量化,就称矢量量化。/ h' J( H# M( h: O6 ?2 m

1 I( A7 {6 k7 _0 q图2-5所示为矢量量化编码解码框图。输入量是一个待编码的矢量xi(i=1, 2, …, m),即先将图像分割成m个方块,其中任一方块i的大小为k(k=n2),以行(或列)便可堆叠成k维矢量xi:(xi1, xi2, …, xik)。码本Y:(y1, y2, …, yN)是一个码字集合,它实际上是一个长度为N的表,表中任一分量yi是一个k维矢量,称为码字。矢量量化编码过程就是从码字集合中选出最紧密适配于输入矢量xi的一个码字yi的过程。在码本中找到与输入矢量xi完全一致的码字yi的概率很小,但只要两者之间的误差最小时,便可用该码字yi来代表输入矢量xi。传输时并不传送码字yi本身,而只传送其下标号“i”。当码本长度为N时,传送下标所需的比特数为log2N。于是传送一个像素所需的平均比特数为(1/k)·log2N。) X, A+ G2 d1 G# ?0 ^
' R& i& R- ^0 _( e* z9 @9 A4 J9 ?
' W' j1 c. s9 J" E$ T
- A( Y9 {- h' F' |
此方法以输入矢量与选出的码字之间失真最小为依据,与标量量化相比,它有更大的数据压缩比。但其关键问题是设计一个良好的码本。
/ @, q$ A+ w/ J( I( p! x7 K. D4 I) l0 L0 j6 p
2.1.5  数据压缩算法综合评价指标, }- d& c9 V$ T  C- h* y# F' |
数据压缩方法的优劣主要由所能达到的压缩倍数、从压缩后的数据所能恢复(或称重建)的图像(或声音)质量、以及压缩和解压缩的速度等几方面来评价。此外,算法的复杂性和延时等也是应当考虑的因素。
0 W, S. w- p4 O! W6 l# h
$ Q% H# |  I  n! W1.压缩的倍数
' x+ G; m4 t, k( p( S7 i& E2 G, y+ K- _  b8 b7 z3 i) r
压缩的倍数也称压缩率,通常有两种衡量的方法:
: q5 z/ }7 ?* q9 |& O5 V, W& J
- @, Y. x& |4 o# }5 P2 f) i7 |1)由压缩前与压缩后的总的数据量之比来表示。例如,一幅1024×768像素点组成的黑白图像,每像素具有8bit,通过使其分辨率降低为512×384,又经数据压缩使每个像素平均仅用0.5bit,则压缩倍数为64倍,或称其压缩率为1:64。
* R3 l! v7 D6 n( M+ l  y; q9 B
/ l# t7 M, c% `( t$ t* w/ a8 A2) 将任何非压缩算法产生的效果(如降低分辨率、帧率等)排除在外,用压缩后的比特流中每个显示像素的平均比特数bpdp(bit per displayed pixel)来表示。例如,以15000字节存储一幅256×240的图像,则压缩率为
/ q$ u- @" U1 ?; ]( R2 Q
" a1 ]2 v, L4 c' t/ ~(15000×8)/(256×240)=2比特/像素0 ~1 l4 g6 Q! H9 S7 E+ v: G

$ S9 K/ s* |. p" \; F7 w2. 图像质量* N3 o4 A) f- p. S* Y4 B% L* G0 Y

/ \/ w7 l' y' y$ P" f数据压缩分为无损压缩和有损压缩。无损压缩是指压缩后的数据经解压缩还原后,得到的数据与原始数据完全相同。不难想像,无损压缩的压缩倍数不会很大。有损压缩则是指压缩后的数据经解压缩还原后,得到的数据与原始数据不完全相同。有损压缩可以获得较大的压缩倍数,但采用大压缩倍数时要保证图像的质量是相当困难的。重建图像的质量通常是使用信噪比SNR(Signal Noise Ratio)来评价,其计算方法是:
$ T/ @& j8 R. w" T
6 R4 h( l$ D6 p+ r7 N# VSNA=10log10(σ2/σ2e )   (2-4) ( Y, ]" o" w. B! b) Q

% E7 q, g$ w3 c4 Y% Y& u( i 4 r5 @3 P0 h7 w1 ?
5 T9 y, C  ]4 R& Y  o
                  
# P1 x- d# G; ?2 u; \+ c
# t# Z# ~1 a* t# I2 ?σ2和σ2e 分别是输入图像的方差与输出图像的均方误差,即
9 ]# s$ {: C" G6 U; m- Y: S" Y1 C: g# z; d. i' `4 A0 ~
σ2 =E{||x||2} 2 T  |& j' y* l6 L( P7 M
σ2e =E{||x-Q(x)||2}
5 ]- Q) c& l# X4 t5 P7 k, k1 }+ z' v0 H
在图像处理中,为减少计算量,经常不计算σ2,而使用下述一种简化计算来算出峰值信噪比PSNA:4 z, x, D# ^& F4 @& G
' f1 i5 @& \& @9 m# D# |: M' b+ `
PSNA=10log10{ (L-1)2/σ2e } (2-5)
0 k0 z3 W5 [0 }( Z8 s0 _" E" N8 n3 b! a. l4 H' o
                  ' I6 B' v9 `3 y$ H' T$ L

  H/ `" Q( ~$ }' ?L表示矢量的量化级数,如8bit量化时,L=256。
, {7 s/ @( a4 z: H' [5 z  e1 g+ z+ V( ?1 @: u% y
由于信噪比并不能够完全反映人对图像质量的主观感觉,国际电联无线电组在CCIR500标准中规定了在严格的观测条件(图像尺寸、对比度、亮度、观测距离、照明等)下对一组标准图像压缩前后的质量进行对比的主观评定标准。具体做法是,由若干人(分专业组和非专业组)对所观测的重建图像的质量按很好、好、尚可、不好、坏五个等级评分,然后按式(2-6)计算平均分数MOS:0 u. S  y5 s- Z! G2 f

" J: r/ L( i# M/ y (2-6) : g& L1 G# z. l+ X% a" f/ S  ^: b2 v) e

/ C/ g9 M7 D3 {! _/ r                                 
$ S3 o8 L$ a, e
* i+ _( Q# j# p, S" O2 C1 M: u  f其中k为类别数,即分数等级,ci为i类别的分数,ni为i类别的评测人数。对于音频数据压缩算法的质量评价也与此类似,可以用信噪比、加权信噪比以及主观评定的MOS来评价。( J, e: m, I( p7 Q& ^4 A6 s
8 E3 H% a* M& n$ c9 E$ g2 R
3. 压缩和解压缩的速度
( {& W" V) ^" d! Z8 t  u8 a% r4 b, [" }- G
压缩和解压缩的速度是压缩系统的两项重要的性能指标。) j; u! K* `; t1 I7 |
  u) s2 `3 o- ~
1)对称压缩。在有些应用中,压缩和解压缩都需要实时进行,这称为对称压缩,如电视会议的图像传输。
. A0 ^3 [0 n  s: }1 w  L+ j" {2 _0 P: w5 v. G; {4 x
2)非对称压缩。在有些应用中只要求解压缩是实时的,而压缩可以非实时的,这称为非对称压缩,如多媒体CD-ROM节目的制作就采用非对称压缩。' n# }! V( s. R' d8 N
1 H/ `# x+ j0 k
3)压缩的计算量。数据的压缩和解压缩都需大量的计算。通常压缩的计算量比解压缩的计算量大。如MPEG的压缩编码计算量约为解码的4倍。在MPEG中规定水平方向的像素≤768,垂直方向的像素≤576。对于352×240的图像,就有1320个8×8的图像块,计算这样一幅图像的DCT变换需126720次乘法运算和638880次加法运算。实时计算30帧/秒的黑白图像,仅DCT变换就需要数倍于一帧图的计算量。若是处理彩色数字电视时,运算次数还要多。* @1 z  b1 X" V3 F" f6 @# O
microlab麦博 发表于 2005-9-25 02:31:00
支持!
pyw0901 发表于 2005-11-11 04:23:00
谢谢楼主啊
& b) k7 f/ r7 B" j( I" C3 J6 a
清秀源 发表于 2005-11-16 00:36:00
  支持~!
audioaz 发表于 2009-8-30 18:25:41
:victory::victory:
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

软硬产品代理咨询服务:声卡:雅马哈UR22C、罗兰声卡、福克斯特、艾肯、阿波罗 、M-audio 、普瑞声纳 、福克斯特、 达思冠系列 音箱:吸顶NS-IW560C、吸顶NS-IW660 、NS-AW350、低音NS-SW050、低音NS-SW100;JBL 吸顶8124、CSS-8006BM;香蕉猴 gibbon系列;普瑞声纳E5XT、E4.5、 E3.5BT 有线话筒:舒尔PGA27、PGA48、MV51、mv88、mv88+、SM27 ;森海E945 、MK4、E835S;舒伯乐top248s;罗德NT1-A、VIDEOMIC、VIDEOMIC GO、VideoMicro、VideoMic NTG 无线领夹麦克风:罗德 wireless go II 一拖一、一拖二;猛犸lark150 耳机:森海HD300 pro、美奇 CR-Buds 、索尼7506、爱科技K240S、K240 MKII、K271 MKII、K52、K72、K92、先锋、飞利浦 1:飞利浦会务通/会议摄像头/全向麦克风/执法仪/录音笔 2:洋铭便携式移动演播室 / 切换台 / 摄控一体摄像机 / 虚拟演播室 / 微金课教室 / 色键器 3:逻兰音视频切换台 / 声卡 / 电子鼓 /电钢琴 /耳机 4:Blackmagic专业摄影机 /调色台 / 切换台/ 广播级转换器 / 监视器 / 采集卡 5:索尼专业摄像机/佳能专业摄像机/松下专业摄像机/ insta360专业摄像机 6:话筒:铁三角/ 舒尔/ 森海塞尔 / AKG / RODE/ BBS 7:音响:YAMAHA/ 声艺 / 皇冠 /JBL / 真力/咪宝/BOSE /美奇 8:声卡:RME/羚羊/IXI /艾肯/PreSonus普瑞声纳/Focusrite福克斯特/YAMAHA/雅马哈/ickb 9:耳机:铁三角/beyerdynamic拜亚动力/AKG爱科技/索尼/RunningMan/美技 10:思锐三脚架 /防潮箱 /米泊三脚架/意美捷三脚架/曼富图三脚架 11:XSW系列,300.500代理商,EWD数字系列代理,6000.9000定制产品,还包销了全国三个型号:XSW1-825,EW100 G4-945,EWD- kk 205

小黑屋|手机版|Archiver|音频应用 (鄂ICP备13005321号-1)

Powered by Audio app

快速回复 返回顶部 返回列表