whqf
发表于 2006-5-27 18:32:00
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
音频压缩技术定义
& m; D# t a4 {4 y( P
- r# d7 U' P2 e. k# x7 B音频压缩技术原理
. P# p8 k0 e$ A1 p6 y 音频信号能进行压缩的依据是音频压缩技术。8 b: z1 M5 S7 S8 |) }( C" R
: a' F2 K$ Q2 h/ h/ A- V% P 音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。
0 O3 A. c+ x! ]* s' N1 `8 s
- \& z+ @) D. T; |0 l, Y 在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩。常见到的MP3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,也就是所要说的主题内容。无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OpTImFROG、Shorten,而常见的、主流的无损压缩格式只有APE、FLAC。/ ~; g6 u6 B$ K/ }0 [& s% w3 V
& q' J5 @2 n: [3 @# n
音频压缩技术原理
9 N! t$ \5 W; r2 J' B
5 w& r; l2 F1 }6 k& L2 s/ g+ t( j3 ]% ]& e) f
1、数字音频相关特点* b8 [7 V9 a0 S5 S" l
; X* M1 b6 \# j" y0 t
数字音频的质量取决于:采样频率和量化位数这两个参数,为了保真在时间变化方向上取样点尽量密,取样频率要高;在幅度取值上尽量细,量化比特率要高,直接的结果就是存储容量及传输信道容量要求的压力8 B0 d: C& y, t2 c h ^
0 f G/ ?5 z" |3 w8 l
音频信号的传输率=取样频率*样本的量化比特数*通道数取样频率=441KHz
( a: U: ]# j$ e% t5 T9 J. W# u3 t Y$ b/ Y/ y J9 {
样本值的量化比特数=169 f9 @; u/ J# f
2 g& H- Z- n8 L: z 普通立体声的信号通道数=2# Q/ A* m2 Y% U, m3 _7 @8 X
! }8 f: D7 _4 Y1 k; b4 _" {7 k7 N) N
数字信号传输码流大约14Mbit/s! e; p& G& E2 | }+ a
9 {( |8 |( L: j8 u" M 一秒钟的数据量为14Mbit/(8/Byte)" e( n+ |( R& w
1 W: s1 N8 [4 f7 |3 `% R 达1764 k byte(字节),等于88200个汉字的数据量
" g$ b6 I; r( s! z9 U2 D
5 g. Y$ Q9 `0 `6 u. R8 ?9 P 数字音频的出现,是为了满足复制、存储、传输的需求,音频信号的数据量对于进行传输或存储形成巨大的压力
+ U q- v) Z0 f' b6 Z4 _. f5 ?5 S; k: j, y. x; Y
音频信号的压缩是在保证一定声音质量的条件下,尽可能以最小的数据率来表达和传送声音信息
1 J$ n9 u: ]6 v" J* }4 e, e% z) G+ x* l
信号压缩过程是对采样、量化后的原始数字音频信号流运用适当的数字信号处理技术进行信号数据的处理,将音频信号中去除对人们感受信息影响可以忽略的成分,仅仅对有用的那部分音频信号进行编排,从而降低了参与编码的数据量. I9 I5 T9 n7 O1 q$ F9 I# P! e+ M9 w
2 j, F# y6 ], N6 U4 o9 n 数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余- K$ g% D: w6 f
; n' T8 _: d2 v+ t4 d A9 Y4 y 2、时域冗余
0 H; @) I# E* ?0 Q% k
8 v( n! h2 F- f9 E! p! E音频压缩技术原理
5 L7 h& s i" C3 W时域与频域的差异
0 m9 H1 E, l* ]3 |1 ]+ ^& q+ s# s
- ] z3 ~1 n3 ]
$ d- b1 Y0 [/ @ b2 k. P' d2 b 时域冗余的表现形式: ` b% n- f0 B- e
& @% g4 R U4 ?9 ^1 M
1)幅度分布的非均匀性6 n9 Z- y1 n* q' t- j
! Y) ]1 h# i8 [2 x* X, k 信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置6 ^- K& X6 s. d5 {; p
5 `0 W `2 u$ S" r7 M4 k
2)样值间的相关性
" T3 x( p7 u4 F7 ~* G' @; y4 I: L
声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多
$ \2 m4 ?' |4 t9 s3 l' R9 u7 X6 E" b1 y- K% i' |; a: \
3)信号周期的相关性& _+ @8 _1 H( ?( H; V
& x x" a3 e7 y8 f( A" c* r. O- H 声音信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周期之间具有相关关系) I( q6 L4 |6 g
0 r. c, b8 w# @( w# J: w7 u 4)长时自我相关性
% K' N4 n$ t2 B" h* Q* P# f3 b N$ p% j
声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数
: c/ b* m2 ^; h' R8 y, T1 e( L% S! [* X* |
5)静音6 a+ d( p4 [( P# p% `* J
0 w. R j% A' d# j) S- \ 声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量1 l. C) e- ^2 y( R# w# V
& H `- L. V/ g$ G& w0 _ |
|
|
|
|