红日今天
发表于 2010-5-1 06:26:56
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
音频、视频压缩有哪些技术标准?
+ A1 ~" R+ g- N5 v$ q. o* \; d9 e6 D$ Q+ G( v: c* @) S
' Y' ]5 p$ R2 V$ s0 n
视频压缩技术有:MPEG-4、H263、H263+、H264等/ g% g0 ~5 v- {( p
& _5 P4 u1 x+ y! K) G
MPEG-4视频编码技术介绍. N( N4 }8 l# Y
" m% s6 B; b$ ~, ~" S F! Q; f: w
MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 & w( e9 z, L$ w% ^
) m+ {# k& S3 y* d k( O, W MPEG4与MPEG1、MPEG2的比较- D# P2 v7 K+ y% r4 u; N
5 t0 M7 h! ]# X u7 W% e- \( m, z
% M3 E& S$ d- c$ M/ r! t+ P0 ]9 G# M8 r" p
从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。
9 m7 |' a5 X# B4 n# X P% R0 l3 g' f5 x% p, z$ B
H.263/H.263+/H.264视频编码技术介绍, |$ m8 J9 X) ^
2 u2 l/ `5 L$ G: Y7 F' _9 j1 z# B# `
H.263视频编码标准
4 ^5 u2 U; W: E: n5 z# z$ A4 o& I9 N9 @, u
H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。它是在H.261基础上发展起来的,其标准输入图像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。H.263与 H.261相比采用了半象素的运动补偿,并增加了4种有效的压缩编码模式。
4 j! \" I v. H6 M g) A
( |9 ]* x- D3 S" O# o! o) \6 G H.263+视频压缩标准 - H0 a3 l7 `9 Y4 [0 A
5 T, u+ H, p, W, z* n( m; d
ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变的基础上,增加了若干选项以提高压缩效率或改善某方面的功能。原H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。为提高压缩效率,H.263+采用先进的帧内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像的主观质量。为适应网络传输,H.263+增加了时间分级、信噪比和空间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码能力。
' G# z. u: [) O; F5 T+ W; q4 E4 W: T: i1 w5 Y2 k
H.264视频压缩标准
. ]- k* |. }& { y* V
- K. `6 n# j5 ?. n H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合,如视频存储等。 ' k# u! W5 r5 ]3 S4 T: G
& [# P/ E. x5 \) f 提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力。 1 c% b- P% T+ S+ X1 z+ \) d& w
1 {% W+ C; p( w: p6 a5 ? 在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用。 & g) x% i( F& A
, n% e9 A& q, X& B) K- E
相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比,同时大大提高了算法的复杂度。 / _! Q! Z u0 x
2 i; M! h! X3 x+ x& |7 f# I* o3 g; N
G.7xx系列典型语音压缩标准介绍
r+ v! v! A3 m1 z% I
# O" a5 [4 d4 l4 h- F4 Y, F G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。! M8 Z) m; O/ K
3 A' h1 e B4 m
国际电信联盟G系列典型语音压缩标准的参数比较: Z( a m. p# y6 ?8 X" S+ M) J
* C9 x% Q8 n& y8 `& w+ n
$ z! |- l6 {& }; @4 o; p" x/ u: y4 T+ _4 D( q" b) G" Y8 ]
在国际标准中,统一使用 MOS(Mean Opinion Score)方法评价语音压缩后的质量。在MOS方法中,电话语音质量的标准定为4分。也就是说,如果一种算法将语音压缩后,MOS 值能达到4分,即说明其语音质量和电话质量等同,用户无法分辨出其中的区别。
* l2 w$ f- J& I* J) T
9 g O, ^" N( a9 q6 Z! K Global IP Sound(简称GIPS)8 o S0 S+ R) U4 y
- ]$ W$ E1 c& R
Global IP Sound(简称GIPS),是瑞典一家全球顶级的专业从事语音编解码引擎的技术公司。是一家位于瑞典斯德戈尔摩的高技术上市公司,成立于1999年,目前只有25位员工,但却拥有世界上最顶尖的语音处理和IP电话技术专家:其公司CTO,Roar Hagen博士,1989年即进入语音处理行业从事开发工作,在世界知名的AT&T贝尔实验室、爱立信研究院工作。他本人发明了超过10项技术专利。Jan Linden博士,在语音处理和通讯领域从业12年。在加入Global IP Sound之前,Jan Linden博士在加州大学和SingnalCom公司供职。Patrik Srqvist,自1995年开始从事语音处理和VoIP研究开发工作,之前在爱立信研究院工作。就是这样一家规模小同时却拥有来自爱立信、AT&T等电信行业巨头的技术专家的公司,却在VoIP引擎市场上取得了令人瞩目的成就。GIPS SoundWare™能为端对端 IP 通信提供较 PSTN 质量更佳的语音体验及保真度,完全不会受数据包丢失的影响。 |
|
|
|
|