马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
音频编码汇总
0 f+ q8 T/ @" U8 X0 t0 z& \PCMU(G.711U)- v. m6 M6 K1 q1 P. B) l
类型:Audio
7 t' B/ _* f* ~制定者:ITU-T
% C" [6 w+ \# I7 E3 @所需频宽:64Kbps(90.4)& o# j/ e. y9 N: r# O1 z+ L
特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。
/ j1 Q$ g J& s. H7 k6 M" n优点:语音质量优' z* E7 y' j4 l8 x$ D( D
缺点:占用的带宽较高1 p7 r0 x" [% f* i- x
应用领域:voip
9 F1 O: H. E t9 }4 ?) J8 U0 ~版税方式:Free
% @# ~" j' A9 `' g! p. q0 l备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。
8 `( ]! z( x2 \
( V# x7 {$ C9 K" ?
4 n8 ~8 G. e2 X5 `# w9 APCMA(G.711A)/ k6 h. z; N" u% |2 }+ z
类型:Audio- y/ n x3 p1 {
制定者:ITU-T8 e% u' ~9 `: e! c( W1 m2 [
所需频宽:64Kbps(90.4)! X1 U9 r \5 A% d
特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。( P4 `' N, ^; j! [+ \3 e' U
优点:语音质量优' r |; r/ f: k
缺点:占用的带宽较高
) q/ Q; a M, p应用领域:voip
3 ?* O, J4 }7 A1 W$ e3 @2 e版税方式:Free
2 w: E9 v! u7 k* y备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。2 }# G1 c% _8 |+ X1 T7 d$ L; x/ ?
9 R; n, S9 D0 E2 G( O1 n' w
, b$ W/ v! S- ~1 t, F: o, Q* cADPCM(自适应差分PCM)7 P, q* t& q3 _- y: L
类型:Audio& \! Y/ p: H' }% d4 H' T: E) I- c9 F
制定者:ITU-T
6 O; _0 n) @0 a+ Q* P) i所需频宽:32Kbps
/ p/ X- S% Z8 |9 x. w特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:
1 L; i. k. r, M$ I: M ①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;
4 ~* o+ q; j5 r% z8 K ②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
* w( Q$ }; f, H6 o ?优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
; P5 L! C% K% e' v! a7 W8 Y缺点:声音质量一般$ T5 U4 }' z/ e2 l' }4 p
应用领域:voip9 C0 Y6 J" d. ^6 l; W, U) C
版税方式:Free
+ B8 s0 I: { {7 D/ R2 i备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对 16bit (或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的 16bit 数据以 4bit 存储, 所以压缩比 1:4. 而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。# z# ?4 l4 n2 |, x
3 p9 e. z: a8 i T. n' B; c8 ~# j0 Z% @: P' u# S
LPC(Linear Predictive Coding,线性预测编码)
, Z& r* O' \- y5 o3 b, g8 ?& ]. ?6 u类型:Audio
t1 D _4 Z. O/ C- v制定者:
. \5 H+ s& c: a: w+ k: V1 p所需频宽:2Kbps-4.8Kbps: P4 m) t& \' G% ^1 E" J9 |+ b# d
特性:压缩比大,计算量大,音质不高,廉价' a& ^$ [3 {( a6 ?! G
优点:压缩比大,廉价. E2 z5 h0 ]0 B* [. s$ D3 m7 d
缺点:计算量大,语音质量不是很好,自然度较低0 w; Y2 W! }+ `2 S3 S
应用领域:voip
; q( f9 o) _5 n) @版税方式:Free
9 o' L, f7 L) h5 r% e( r备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。如:线性预测编码(LPC)及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。
! R8 b2 A+ F% O, j f& x$ l
2 Z7 Q( p. J3 X! Q2 A7 i- {4 G- A0 k6 \
CELP(Code Excited Linear Prediction,码激励线性预测编码). m% B+ j) |& g& ~ c* K: i; Z
类型:Audio
1 X) x/ @$ n2 t: L( a+ J* l制定者:欧洲通信标准协会(ETSI)
; I- {2 g1 C A6 s) q所需频宽:4~16Kbps的速率
+ p% d( P- X2 N8 c+ b/ v特性:改善语音的质量:1 G; p" G- F! o# i7 W# b
① 对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;
$ x! S% | W# g6 ^ ②用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量;- Q1 i* `- }( e
③ 使用修正的MSPE准则来寻找 “最佳”的延迟,使得基音周期延迟的外形更为平滑;4 n/ ^' E& v2 I# e$ Q( r& c
④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量; ⑤ 使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。
7 z4 L( p. ?1 F! I5 y, K 结论:
7 a1 @: p# E. H1 K* _ ① CELP算法在低速率编码环境下可以得到令人满意的压缩效果;/ ]8 W: ]" x, n& _+ `+ o1 v
②使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现;
( n* X5 b9 | B1 G( B3 W ③CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。# m) H8 P J( k$ [4 t4 H e
优点:用很低的带宽提供了较清晰的语音
# E6 L4 d8 I2 j+ C4 c% L缺点:
) h; U6 v) O& D1 b应用领域:voip
: r* g( ]! X" x% C% ~) y版税方式:Free- Q' ~+ J1 K5 e& z6 r5 F# \; W8 x
备注:1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。CELP 码激励线性预测编码是Code Excited Linear Prediction的缩写。CELP是近10年来最成功的语音编码算法。
7 H( T2 u9 q( K* q! x4 x8 P CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。. ^0 q- T/ E* C( {: p. H$ D- C1 w
CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。CELP (Code-Excited Linear Prediction) 这是一个简化的 LPC 算法,以其低比特率著称 (4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。CELP是一种在中低速率上广泛使用的语音压缩编码方案。* C' U( j7 ?* y% j3 ~7 e* [% @
% {7 D' A! x# m# p2 |6 _7 E7 N
- k1 [6 n& k4 xG.711$ k0 Z( R, x c" G
类型:Audio' Y4 @0 i6 |. ]2 Y: M8 i
制定者:ITU-T$ n2 k1 p* z7 ]7 H j5 D k
所需频宽:64Kbps
, c/ e4 M$ D' Z! W& ^, i特性:算法复杂度小,音质一般$ s1 C) C8 ^- _/ ~. R: z+ |+ R
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)% Y6 p9 C4 l5 U, ?% V
缺点:占用的带宽较高
! i$ ~. A0 M2 w) ]+ f3 C% _; X应用领域:voip
+ C) }* [7 ~. E( d版税方式:Free
- V. @4 b6 H" b! }备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。# s# z3 r% I, m9 u& {3 i& ]0 }' \. ~7 u
; n+ J( \9 f) n! w( f! I) u A5 g- H/ d* \ F( t: M
G.721
2 `% C. G5 S5 O* l类型:Audio/ E, M3 }5 a, |/ ~; X; ~
制定者:ITU-T e% O( L7 `1 w+ d* F' [ Z
所需频宽:32Kbps
# j! V7 u8 P" V! v6 Z, p特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。( d- z. c$ ^, d5 L+ Q! K' m
优点:压缩比大
, N$ {$ X/ p( l; B缺点:声音质量一般
9 Z( q K. a, m; ~6 i2 D/ ~" f; w应用领域:voip
9 Y, A' C0 H. _9 x版税方式:Free
* h" t$ u! Y/ E( U: k备注:子带ADPCM(SB-ADPCM)技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。
7 w& H0 u& T+ l/ j4 [8 x& C5 G, h7 {! l& k, u& W/ U
: H u7 I' w/ Z% g2 SG.722
# }/ A6 j% w. i& _$ a2 s类型:Audio
3 _3 @# j' p: w2 u8 V" {$ W) t" Y制定者:ITU-T
/ U$ [/ j: c) k+ C6 v# {所需频宽:64Kbps; ^+ i& s: z/ W X2 x
特性:G722能提供高保真的语音质量
+ ?& r& ~! U. I优点:音质好; ^, ^% j, |4 y0 b% O$ m
缺点:带宽要求高5 A- [* }/ M5 m* n- L- P3 `
应用领域:voip
" Y: \* w2 C0 J0 S版税方式:Free
7 c" c1 ^3 }! R4 J备注:子带ADPCM(SB-ADPCM)技术) a! c$ D! w) A. Y
: W' j% C& C) c) E. ] b8 @5 Z0 j. V; y1 X# b0 m3 @
G.723(低码率语音编码算法)# |/ n- l- c8 @1 x+ j! g( o; H
类型:Audio
2 F, m1 A5 d/ m; `制定者:ITU-T
0 O5 r) T( f) m. f0 \+ ?5 m所需频宽:5.3Kbps/6.3Kbps
. S5 T r/ Z4 X# h9 _0 B5 G- Y% k特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder。达到ITU-TG723要求的语音质量,性能稳定。可用于IP电话语音信源编码或高效语音压缩存储。( Q1 L7 h7 V; g# @! r6 }6 A7 Q
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定。7 y$ m& ^( q$ @6 W: |
缺点:声音质量一般
7 ~/ h* t. z1 a# `% }1 N7 B9 ^应用领域:voip9 C7 ]( r" P& C! Z7 T+ w
版税方式:Free
7 ]! x# o! z- b: _% L备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。* ^) z- e5 g; A8 A+ i
3 z; u; B6 M4 g9 Y/ [0 ?5 d. r
3 F9 d" ]7 r+ c% q. x0 W; g- _+ H, IG.723.1(双速率语音编码算法)" M, s2 o' Z+ H! x' N
类型:Audio
+ I" E1 Y6 z5 i, o- M制定者:ITU-T
u9 ~2 y; y5 s, }所需频宽:5.3Kbps(22.9)- e8 c+ s% i2 h9 }" ~! J
特性:能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的。G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。
: j9 K5 |4 N7 H3 Z优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。! [3 B& A/ e6 I7 d- Z3 G
缺点:语音质量一般! |* Y, S+ N. T
应用领域:voip7 H$ S$ d/ J* n! c! {
版税方式:Free2 D* I! \' [% o1 v
备注:G.723.1算法是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统 。目前该算法已成为IP电话系统中的必选算法之一。
; m- G* H+ A9 T9 Z( e& Q
% h7 ^% X+ [; W8 l1 e9 v; e" K X9 n5 g
G.7284 M5 \+ F$ i2 d7 F4 t8 ~
类型:Audio
- }% _$ ^- Y, {制定者:ITU-T
+ f8 ~$ Q: _% c( c所需频宽:16Kbps/8Kbps- _7 \ p# O( s: j! B$ Y8 Q& K+ ^: g
特性:用于IP电话、卫星通信、语音存储等多个领域。G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。" M) j# D" I$ V( ^! g7 ~& {" U
优点:后向自适应,采用自适应后置滤波器来提高其性能) Y% D9 h# E0 u6 f9 A4 X
缺点:比其它的编码器都复杂
3 f0 ~" g* x# y- h: {7 G4 ?- w应用领域:voip
$ e- ?7 e k$ G7 e0 S- p" G8 Y& d版税方式:Free. Z8 {3 g( h" I
备注:G.728 16kb/s短延时码本激励线性预测编码(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP电话、卫星通信、语音存储等多个领域。16 kbps G.728低时延码激励线性预测。 0 q5 B: y2 E4 P5 i8 J& U5 W) ]( z6 i
G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。G.728是LD-CELP编码器,它一次只处理5个样点。对于低速率(56~128 kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。5 a* m9 m2 g" \/ q' J; p; Q' ^6 Z/ \
2 y4 e& L+ Z+ X2 |3 W- ?
* l% b& ~# ^1 G8 n7 B9 dG.729
/ A, e6 o3 y) }1 e类型:Audio
$ j& V+ H* m! ]; a' E% o- h3 j制定者:ITU-T
6 y( {) X, b- z: b+ a7 ?所需频宽:8Kbps
# L( ~; p! l: s1 r: b! U8 c, m特性:在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。& o3 c/ `; E+ R
G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。
) u' H* }( k) n+ J; j G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。2 Q: Q! F* { m2 W( N; B5 Q
优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制" d* Y% E S- I# P2 E4 i$ @8 E
缺点:在处理随机比特错误方面性能不好。
9 A- U8 C7 X0 M9 f; P; K应用领域:voip$ y5 [7 |. p& i4 ?
版税方式:Free) |1 s3 x3 P+ }
备注:国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。: y/ H" x: j) L$ a9 ~
# ]; U) ] y1 G0 O: }
/ G- Y3 f5 D) h2 M' hG.729A
; l/ a! N; w5 w$ _7 s* Q9 \. M类型:Audio) a2 M) ^4 H; _) m* s4 F
制定者:ITU-T4 [7 D; ^8 d' z: p
所需频宽:8Kbps(34.4)
% l0 s$ K+ g5 V& ~, s: |+ f特性:复杂性较G.729低,性能较G.729差。
0 a$ d- Q3 Q- i7 n. L$ |) u优点:语音质量良,降低了计算的复杂度以便于实时实现,提供了对帧丢失和分组丢失的隐藏处理机制2 b& r. i: k# p3 b+ t/ V) B
缺点:性能较G.729差* Q1 s7 F/ F u
应用领域:voip4 ~0 W5 P* G- _" _4 ?! r
版税方式:Free$ \% m$ [8 W( z' | ]
备注:96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。* s) W2 L3 e- F$ F
2 k ?& E d4 k& ]+ @' ~4 @; N5 K+ @% o8 B+ M2 A0 @
GIPS
9 R( i+ Z; I" @+ d类型:Audio6 d4 A4 i3 L- F7 V
制定者:瑞典Global IP Sound公司
+ i7 s. }! ?+ z所需频宽:8 Z( c+ X: a6 ]! Z% ]! s% T# V
特性:GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频。GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果。
6 m3 ~' S, B4 T( I9 J2 ? J优点:很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果3 ^$ K. [4 r9 R; G
缺点: 不是Free. x. q- q2 G( V
应用领域:voip9 z% p2 q- W! \+ r
版税方式:每年支付一笔使用权费用' w6 Z/ q5 g- _ x
备注:GIPS音频技术是由来自瑞典的全球顶尖的语音处理高科技公司--"GLOBAL IP SOUND"提供的专用于互联网的语音压缩引擎系统。GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频。GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比电话还清晰的语音通话效果。: B1 _) I; r2 g9 ^& o9 Y! o
5 w$ ]% b- L, j$ |0 r, \
, P1 |+ k! p+ H( T1 YApt-X+ q4 f3 O: z5 _7 U) i
类型:Audio* o% T3 y3 c& l% G1 U! z& r, x
制定者:Audio Processing Technology 公司5 v* c1 m3 m) [8 _6 M/ d5 s
所需频宽:10Hz to 22.5 kHz,56kbit/s to 576 kbit/s(16 bit 7.5 kHz mono to 24-bit, 22.5kHz stereo)5 F* ~# M3 N0 ]5 \. y
特性:主要用于专业音频领域,提供高品质的音频。其特点是:" [$ R: c' ]3 I* I) |) R
①采用4:1:4的压缩与放大方案;; R) ~1 @3 ^; b
②硬件低复杂度;
# y4 X2 J7 r3 {/ |) Z ③极低的编码延迟;
4 h; ?/ ~0 K' j- M2 h& M ④由单芯片实现;
* p0 r( R* Z: d$ D" ~ ⑤单声道或立体声编解码;
! c; U9 M0 C( y$ c ⑥只需单设备即可实现22.5kHz的双通道立体声;
- i O7 ~& |. x7 | ⑦高达48kHz的采样频率;
% k* Q% S5 _, `' | ⑧容错性好;% H# k2 ]0 Q5 q1 Q1 r; |' S
⑨完整的AUTOSYNC™编解码同步方案;
& e% u/ y$ C: v4 p1 z ⑩低功率消耗
4 O+ [. d. B; Y" H$ ]' Z: A优点:高品质的音频,硬件复杂度低,设备要求低% ?. s: J+ @* j- Q
缺点:不是Free
0 o! G! y0 X- o# n. e9 C5 ?0 m应用领域:voip
n: h; R- _7 h3 `/ U6 Y. J8 @版税方式:一次性付费
& u. w: A, _' w- a备注:子带ADPCM(SB-ADPCM)技术
5 N+ z) Q# f* _7 [
6 \" h4 V; p' ~1 T/ J. ?5 V. G# e, b
NICAM(Near Instantaneous Companded Audio Multiplex 准瞬时压扩音频复用), F' j5 `+ i1 e6 U0 Y4 D1 ~$ p
类型:Audio
8 `! S( |0 x$ r$ F/ T制定者:英国BBC广播公司! y( E: U; N# C6 P% m1 H
所需频宽:728Kbps' S- a9 v6 t8 ?
特性:应用范围及其广泛,可用它进行立体声或双语广播
# z- p& a, y4 M. q3 X! }5 d优点:应用范围及其广泛,信噪比高,动态范围宽、音质同CD相媲美,故名丽音,因此NICAM又称为丽音
5 E3 S1 K5 K+ ~缺点:不是Free,频宽要求高
, D% s6 k+ Y, W/ C3 P5 v, j应用领域:voip
8 O6 Z7 _0 q5 z9 i版税方式:一次性付费* Y3 T! p o& C: Y& \
备注:NICAM也称丽音,它是英文Near-Instantaneously Companded Audio Multiplex的缩写,其含义为准瞬时压扩音频复用,是由英国BBC广播公司开发研究成功的。. B/ @! r% R- O: M* V% |
通俗地说NICAM技术实际上就是双声道数字声技术,其应用范围及其广泛,最典型的应用便是电视广播附加双声道数字声技术,利用它进行立体声或双语广播,以充分利用电视频道的频谱资源。这是在常规电视广播的基础上无需增加许多投资就可以实现的。在进行立体声广播时,它提高了音频的信号质量,使其接近CD的质量。而且还可以利用NICAM技术进行高速数据广播及其他数据传输的增殖服务,这在当今的信息化社会中似乎就显得尤为重要了!
' v1 e5 `2 i- L9 P
& e" j2 c, M3 c+ D: A% m& [2 P) T
" K) g8 d5 l9 Z8 c1 X" k# GMPEG-1 audio layer 1) N% t5 T# }: ?, b; K) A* y
类型:Audio2 k& l; Q O) E7 a+ P1 S
制定者:MPEG; W( \& m, h6 `5 d- M2 W
所需频宽:384kbps(压缩4倍)
; E4 x6 q' E2 S! y- \9 P/ M2 W特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
- o/ N+ U9 A; Y6 U优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
. Q# C' p( ]" ?$ z6 w" _' f缺点:频宽要求较高" \+ {4 n3 Q3 V+ E% {4 I1 G, u7 d
应用领域:voip
1 b1 Q O# v B: W) |: U; ^版税方式:Free& Z; y2 |8 a5 f0 a; |' x0 R9 G
备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次: C4 l' v$ V+ o/ }8 I
--层1(Layer 1):编码简单,用于数字盒式录音磁带! w4 A8 N- y9 `1 T0 ?. J6 H
--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等' Y' t% M! T# v, q
--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍5 @' q4 I# t% M1 [
+ z# x( e+ q/ C/ |4 T6 B8 J4 y* k7 R! h9 M2 b' R
MUSICAM(MPEG-1 audio layer 2,即MP2)
2 j- q) s" f% U( l0 i6 T类型:Audio
1 T, d- H; _/ s" w7 U3 m; `! p J H制定者:MPEG
9 }2 ]# |4 }; p3 T% A$ n所需频宽:256~192kbps(压缩6~8倍)
5 i3 O+ W; A% f- x9 @ Y! Z+ Y U) K特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
% {% h( D* I$ p# L9 V( z优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)) N" S4 U* \0 C* i# r6 r/ l
缺点:
4 A, s2 g5 M/ Q0 H% E应用领域:voip$ w# W/ ^' j. \: |1 X) h% v( M
版税方式:Free/ I, j8 }2 U E
备注:同MPEG-1 audio layer 1
$ P& `& f$ i* R! ? g; \
p+ V7 `& [2 C9 l" C, d: K$ M2 A* d1 S
MP3(MPEG-1 audio layer 3)2 T( H* d0 y1 E1 n9 D }: x
类型:Audio
2 q5 T/ ~! b4 d4 s% t5 }; e, N制定者:MPEG
+ F0 ~- @9 k0 p9 B所需频宽:128~112kbps(压缩10~12倍)
; M' b8 s3 ~# q3 r特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。6 g: R0 }* W! `+ T$ y; a
优点:压缩比高,适合用于互联网上的传播
4 Z! j: X) z" y- T1 Y! Z. T) F* V缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失2 m6 `4 n* q* Z/ c
应用领域:voip _7 e" U8 u3 K$ b5 t6 E
版税方式:Free. Q6 M3 l9 ~( B- x9 P. q, i
备注:同MPEG-1 audio layer 1
5 e4 E2 U; @. t$ C. V5 T: G/ u4 C6 H- ~ X1 Z
MPEG-2 audio layer
. G) s) Z: Y! G1 d" J类型:Audio
n) I. y# L& s9 B, u制定者:MPEG
; b+ I+ Z5 [; Q1 o4 G7 u8 N所需频宽:与MPEG-1层1,层2,层3相同- `6 ~ I/ }, ]! r; l8 t0 v! \
特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。( N# [0 l' b. e/ m1 x& m4 D
优点:支持5.1声道和7.1声道的环绕立体声
: J, H ^/ ^, m; J. [缺点:
5 p. _$ D- L8 Y应用领域:voip
, F" D5 J2 c Q* [, M' ]. Y+ M) l; X' m版税方式:按个收取
! ^ a# ^ x4 t0 p$ D备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
5 d9 h; s. ?5 V+ E- C) r
" [# B+ o9 w) l( R8 [- t; i
' d: X0 Q) O) `% \AAC(Advanced Audio Coding,先进音频编码)6 A0 E6 a3 i4 J9 D
类型:Audio! ]. n3 W8 ~0 P% D6 F
制定者:MPEG8 j9 |" R6 \7 ^- i' R7 W
所需频宽:96-128 kbps
0 x% B9 B" s0 J Y9 U特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。
$ u* l7 ^( C2 H" D( Y" i ^" m+ b AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48 个主要音频通道,16 个低频增强通道,16 个集成数据流, 16 个配音,16 种编排。
6 W+ A9 ]- l# t( w/ X3 Q! h优点:支持多种音频声道组合,提供优质的音质
( I7 i8 _& k/ L- b E/ A缺点:
5 j& s/ p( `; p+ }. u: h应用领域:voip4 I+ [0 a% h; I* J3 x* i
版税方式:一次性收费
- V2 e( I$ i' |+ S' }备注:AAC于1997年形成国际标准ISO 13818-7。先进音频编码(Advanced Audio Coding--AAC)开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。% r, a$ ]6 L; {% y9 [, p3 z
在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2 AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不同的工具。& ~" B3 E: p/ y
+ W# i9 @, ]2 |& a1 W2 h
# B2 V6 K, j* i+ z. s5 n0 ODolby AC-3
8 W, e4 j8 f5 j( @8 f类型:Audio4 u- o" i \8 ^4 x* W+ s: ?
制定者:美国杜比公司1 o- Q8 a2 `0 }* P
所需频宽:64kbps
0 F( e: q/ k& X5 C( @$ P2 k特性:提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。
/ x/ Q2 {5 r2 b+ e3 q, \优点:环绕立体声,信息损失很少,细节丰富,具有真正的立体声效果
2 z- S8 ]- l2 |4 q缺点:
- m# A) p% l9 T. j& ^应用领域:voip! a% K2 ^# ^$ v% ^$ a
版税方式:按个收取
# H7 Z8 a @; a- j1 v. _' T- Y! `备注:杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。
" h, I' H& \) g: b: t; h# k& [ E x; X" e6 v( U y4 K1 w
( M" _& H [& t3 c5 Q" X0 aASPEC(Audio Spectral Perceptual Entropy Coding)* P2 Z% V0 r# F G2 E
类型:Audio' S3 F3 x! H6 }4 v; |! I
制定者:AT&T
1 ~- S" r2 l& d! p所需频宽:64kps
, h9 x n. |- R# p特性:音频质量获得显著改善,不过计算复杂度也大大提高,而且在回响、低码率时声音质量严重下降。
- [/ Q% }% H# G, ?3 o9 A( _1 x" f优点:音频质量获得显著改善* ^ ^3 N5 Z2 K7 }; Q: u( R: X
缺点:计算复杂度的提高。块边界影响、预计算复杂度的提高。回响、低码率时声音质量严重下降
; `* ^$ H8 D8 A6 N$ j0 m应用领域:voip- o# U2 L3 N9 {
版税方式:按个收取9 w- `! ?% p6 n2 R* ?- [7 Q7 c+ h; M
备注:变换压缩技术3 k+ E4 [8 B) L( F! C9 s Y
& W) F# ~) A3 V* U. ?7 J
$ @& I/ H0 U! {- Y% ^- a0 g* MPAC(Perceptual Audio Coder)- w3 Q9 z X( U! I7 I8 L2 ?9 i
类型:Audio" G0 C* l' s( a8 H& {3 i
制定者:AT&T
& m7 h( \ C2 j+ T所需频宽:64kps& S' F. D3 u. v5 L( ]
特性:音频质量获得显著改善,不过在回响、低码率时声音质量严重下降。
0 A$ X, V+ |( {1 U( h优点:音频质量获得显著改善; ~ U/ C' L( N- z( }5 |
缺点:块边界影响、预回响、低码率时声音质量严重下降
1 I4 Y' Z7 j, Q& t& f( Z4 u应用领域:voip- {) V+ M* A6 ]& Y, v3 l
版税方式:按个收取7 D; M U4 O. R5 K, z& D5 Y
备注:变换压缩技术0 P4 L) J5 s0 ^1 e' B
; W" w. k5 F4 ]! b' e3 A5 e1 W
2 @7 a$ J9 F) R4 i! r5 c8 l
1 ^3 [$ V" r! k& a. w
|