音频压缩技术原理_二手音频_音频应用论坛 - Powered by AUIOAPP

音频应用论坛

 找回密码
 快速注册

QQ登录

只需一步,快速开始

搜索
热搜: 音频应用

[音频] 音频压缩技术原理

[复制链接]
whqf 发表于 2006-5-27 18:32:00

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
 音频压缩技术定义
& m; D# t  a4 {4 y( P
- r# d7 U' P2 e. k# x7 B音频压缩技术原理
. P# p8 k0 e$ A1 p6 y  音频信号能进行压缩的依据是音频压缩技术。8 b: z1 M5 S7 S8 |) }( C" R

: a' F2 K$ Q2 h/ h/ A- V% P  音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。
0 O3 A. c+ x! ]* s' N1 `8 s
- \& z+ @) D. T; |0 l, Y  在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩。常见到的MP3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,也就是所要说的主题内容。无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OpTImFROG、Shorten,而常见的、主流的无损压缩格式只有APE、FLAC。/ ~; g6 u6 B$ K/ }0 [& s% w3 V
& q' J5 @2 n: [3 @# n
  音频压缩技术原理
9 N! t$ \5 W; r2 J' B
5 w& r; l2 F1 }6 k& L2 s/ g+ t( j3 ]% ]& e) f
  1、数字音频相关特点* b8 [7 V9 a0 S5 S" l
; X* M1 b6 \# j" y0 t
  数字音频的质量取决于:采样频率和量化位数这两个参数,为了保真在时间变化方向上取样点尽量密,取样频率要高;在幅度取值上尽量细,量化比特率要高,直接的结果就是存储容量及传输信道容量要求的压力8 B0 d: C& y, t2 c  h  ^
0 f  G/ ?5 z" |3 w8 l
  音频信号的传输率=取样频率*样本的量化比特数*通道数取样频率=441KHz
( a: U: ]# j$ e% t5 T9 J. W# u3 t  Y$ b/ Y/ y  J9 {
  样本值的量化比特数=169 f9 @; u/ J# f

2 g& H- Z- n8 L: z  普通立体声的信号通道数=2# Q/ A* m2 Y% U, m3 _7 @8 X
! }8 f: D7 _4 Y1 k; b4 _" {7 k7 N) N
  数字信号传输码流大约14Mbit/s! e; p& G& E2 |  }+ a

9 {( |8 |( L: j8 u" M  一秒钟的数据量为14Mbit/(8/Byte)" e( n+ |( R& w

1 W: s1 N8 [4 f7 |3 `% R  达1764 k byte(字节),等于88200个汉字的数据量
" g$ b6 I; r( s! z9 U2 D
5 g. Y$ Q9 `0 `6 u. R8 ?9 P  数字音频的出现,是为了满足复制、存储、传输的需求,音频信号的数据量对于进行传输或存储形成巨大的压力
+ U  q- v) Z0 f' b6 Z4 _. f5 ?5 S; k: j, y. x; Y
  音频信号的压缩是在保证一定声音质量的条件下,尽可能以最小的数据率来表达和传送声音信息
1 J$ n9 u: ]6 v" J* }4 e, e% z) G+ x* l
  信号压缩过程是对采样、量化后的原始数字音频信号流运用适当的数字信号处理技术进行信号数据的处理,将音频信号中去除对人们感受信息影响可以忽略的成分,仅仅对有用的那部分音频信号进行编排,从而降低了参与编码的数据量. I9 I5 T9 n7 O1 q$ F9 I# P! e+ M9 w

2 j, F# y6 ], N6 U4 o9 n  数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余- K$ g% D: w6 f

; n' T8 _: d2 v+ t4 d  A9 Y4 y 2、时域冗余
0 H; @) I# E* ?0 Q% k
8 v( n! h2 F- f9 E! p! E音频压缩技术原理
5 L7 h& s  i" C3 W时域与频域的差异
0 m9 H1 E, l* ]3 |1 ]+ ^& q+ s# s
- ]  z3 ~1 n3 ]
$ d- b1 Y0 [/ @  b2 k. P' d2 b  时域冗余的表现形式: `  b% n- f0 B- e
& @% g4 R  U4 ?9 ^1 M
  1)幅度分布的非均匀性6 n9 Z- y1 n* q' t- j

! Y) ]1 h# i8 [2 x* X, k  信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置6 ^- K& X6 s. d5 {; p
5 `0 W  `2 u$ S" r7 M4 k
  2)样值间的相关性
" T3 x( p7 u4 F7 ~* G' @; y4 I: L
  声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多
$ \2 m4 ?' |4 t9 s3 l' R9 u7 X6 E" b1 y- K% i' |; a: \
  3)信号周期的相关性& _+ @8 _1 H( ?( H; V

& x  x" a3 e7 y8 f( A" c* r. O- H  声音信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周期之间具有相关关系) I( q6 L4 |6 g

0 r. c, b8 w# @( w# J: w7 u  4)长时自我相关性
% K' N4 n$ t2 B" h* Q* P# f3 b  N$ p% j
  声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数
: c/ b* m2 ^; h' R8 y, T1 e( L% S! [* X* |
  5)静音6 a+ d( p4 [( P# p% `* J

0 w. R  j% A' d# j) S- \  声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量1 l. C) e- ^2 y( R# w# V

& H  `- L. V/ g$ G& w0 _
 楼主| whqf 发表于 2006-5-28 18:34:00
 3、频域冗余6 ^: v$ j9 z; I  ?; ]4 P" g

( k9 m, O& c6 y8 R/ v( z/ O' A5 V: E5 S% ^+ @7 @) c3 ]
3 i8 d) i1 g( F+ W+ z9 O
  频域冗余的表现形式" ~8 ^) H% ^3 t5 F

/ _# R  F3 _+ Z" @; x$ ?- _  1)长时功率谱密度的非均匀性  k  C% H8 h  m+ F% C  l

+ _$ N1 g0 M6 L/ Q$ |! S  任何一种声音信息,在相当长的时间间隔内,功率分布在低频部分大于高频部分,功率谱具有明显的非平坦性,对于给定的频段而言,存在相应的冗余. N+ S- L" Q- P+ p% m
! X* z2 ^, Y( \' K* C( o
  2)语言特有的短时功率谱密度  Y, j3 `* g- s. Z
6 s0 i& @( n/ h* p1 y3 G8 B
  语音信号在某些频率上会出现峰值,而在另一些频率上出现谷值,这些共振峰频率具有较大的能量,由它们决定了不同的语音特征,整个语言的功率谱以基音频率为基础,形成了向高次谐波递减的结构
+ s/ e# s- `, f6 u8 b) N5 i# |7 |( j4 z; e1 P
  4、听觉冗余4 ]! r" ]( @3 g4 }/ j0 E# O
2 {+ z+ w0 I7 w0 L* |# g6 G
  根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型,将通过听觉领悟信息的复杂过程,包括接受信息,识别判断和理解信号内容等几个层次的心理活动,形成相应的连觉和意境
- v$ {/ [8 n  U% L4 Q( o3 g
* N( ~; ~, _( q% m  ~  由此构成声音信息集合中的所以数据,并非对人耳辨别声音的强度、音调、方位都产生作用,形成听觉冗余
6 ]. D# S& E/ \0 d2 I; c! ?2 t
" x3 H7 x% Q1 G5 n  由听觉冗余引出了降低数据率,实现更高效率的数字音频传输的可能
$ {. x% O! N# |, [$ h- I; M& ~9 c  N
0 `, D  ]# t" o4 ]
. n# t+ l4 o4 I! `5 ]. E9 M; L音频压缩技术原理
梅花雪 发表于 2006-5-28 19:03:00
<P>为清风鼓掌!</P>
guowenjie8 发表于 2006-6-2 09:14:00
点赞了,好文章,不错啊,可以收藏学习了啊!~
hifi0729 发表于 2006-6-3 03:16:00
支持清风!
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

软硬产品代理咨询服务:声卡:雅马哈UR22C、罗兰声卡、福克斯特、艾肯、阿波罗 、M-audio 、普瑞声纳 、福克斯特、 达思冠系列 音箱:吸顶NS-IW560C、吸顶NS-IW660 、NS-AW350、低音NS-SW050、低音NS-SW100;JBL 吸顶8124、CSS-8006BM;香蕉猴 gibbon系列;普瑞声纳E5XT、E4.5、 E3.5BT 有线话筒:舒尔PGA27、PGA48、MV51、mv88、mv88+、SM27 ;森海E945 、MK4、E835S;舒伯乐top248s;罗德NT1-A、VIDEOMIC、VIDEOMIC GO、VideoMicro、VideoMic NTG 无线领夹麦克风:罗德 wireless go II 一拖一、一拖二;猛犸lark150 耳机:森海HD300 pro、美奇 CR-Buds 、索尼7506、爱科技K240S、K240 MKII、K271 MKII、K52、K72、K92、先锋、飞利浦 1:飞利浦会务通/会议摄像头/全向麦克风/执法仪/录音笔 2:洋铭便携式移动演播室 / 切换台 / 摄控一体摄像机 / 虚拟演播室 / 微金课教室 / 色键器 3:逻兰音视频切换台 / 声卡 / 电子鼓 /电钢琴 /耳机 4:Blackmagic专业摄影机 /调色台 / 切换台/ 广播级转换器 / 监视器 / 采集卡 5:索尼专业摄像机/佳能专业摄像机/松下专业摄像机/ insta360专业摄像机 6:话筒:铁三角/ 舒尔/ 森海塞尔 / AKG / RODE/ BBS 7:音响:YAMAHA/ 声艺 / 皇冠 /JBL / 真力/咪宝/BOSE /美奇 8:声卡:RME/羚羊/IXI /艾肯/PreSonus普瑞声纳/Focusrite福克斯特/YAMAHA/雅马哈/ickb 9:耳机:铁三角/beyerdynamic拜亚动力/AKG爱科技/索尼/RunningMan/美技 10:思锐三脚架 /防潮箱 /米泊三脚架/意美捷三脚架/曼富图三脚架 11:XSW系列,300.500代理商,EWD数字系列代理,6000.9000定制产品,还包销了全国三个型号:XSW1-825,EW100 G4-945,EWD- kk 205

小黑屋|手机版|Archiver|音频应用 (鄂ICP备13005321号-1)

Powered by Audio app

快速回复 返回顶部 返回列表