马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
" ^7 @( B. e) i, d; b+ g[tr][td]一、声音的基本概念 声音是通过一定介质传播的连续的波。* J' {4 C- h; \ L2 E
4 C! H; W* {. Y) y2 a/ Y
重要指标:
3 k$ q! q1 j1 }, L, S1.振幅:音量的大小
" Q6 }! Q! C4 V- R4 g0 c2.周期:重复出现的时间间隔
3 q: {9 k" q4 b# R& [5 I: g/ `3.频率:指信号每秒钟变化的次数 声音按频率分类: L: |+ r, V1 X% N+ o. U
上图 声音的频率(语音信号频率范围:300Hz-3kHz)
2 K% l& g8 u$ ^' y1 a8 A; c# G声音的传播携带了信息,它是人类传播信息的一种主要媒体。 声音的三种类型:
: u: B7 E, e, ? n2 O3 \1.波形声音:包含了所有声音形式
% b) h: H7 \# H' {2.语音:不仅是波形声音,而且还有丰富的语言内涵(抽象→提取特征→意义理解): s; H7 p0 N+ E
3. 音乐:与语音相比,形式更规范。音乐是符号化的声音。 二、声音的数字化1.声音信号的类型
/ k/ s* V0 A' `$ N' I) t/ v•模拟信号(自然界、物理)* S( k" r! K, Z5 l5 `% E
•数字信号(计算机), b. L& p" n0 w; u" g( j' h7 y
2.声音数字化过程. Z# U( x5 [1 d* R; B" _- g
3.声音数字化过程示意图 4.声音数字化三要素 8 U6 |" G% ?: H+ I1 l
采样频率 | 量化位数 | 声道数 | 每秒钟抽取声波幅度样本的次数 | 每个采样点用多少二进制位表示数据范围 | 使用声音通道的个数 | 采样频率越高 声音质量越好 数据量也越大 | 量化位数越多 音质越好 数据量也越大 | 立体声比单声道的表现力丰富,但数据量翻倍 | 11.025kHz 22.05 kHz 44.1 kHz | 8位=256 16位=65536 | 单声道 立体声 |
8 q$ X" K5 f- |9 U5.声音数字化的数据量 音频数据量=采样频率×量化位数×声道数/8(字节/秒) ; J: J" }' {1 T. U2 F# M. z8 ^9 t
采样频率 (kHz) | 量化位数 (bit) | 数据量(KB/s) | 单声道 | 立体声 | 11.025 | 8 | 10.77 | 21.35 | 16 | 21.53 | 43.07 | 22.05 | 8 | 21.53 | 43.07 | 16 | 43.07 | 86.13 | 44.1 | 8 | 43.07 | 86.13 | 16 | 86.13 | 172.27 | P {$ c; e2 G9 Z J
2 j! T1 |+ H8 f5 n& J# J
三、音频的文件格式 1.WAV文件
1 P7 c1 W! `+ b$ b0 tWAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。$ r* b, Z$ ~: @. y
特点:声音层次丰富,还原音质好 2.MP3文件
% p% Y* t) a& [. gMP3(MPEG Audio layer3)是一种按MPEG标准的音频压缩技术制作的音频文件。
6 r& T$ }2 _2 x1 f5 N5 ~2 D( n6 {特点:高压缩比(11:1),优美音质 3.WMA文件4 V0 |: c0 o0 p- n
WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。
' W2 v! G$ {( @ l; c" u' j/ ~1 F特点:压缩到MP3一半 4.MIDI文件
- x! H t3 }$ ~# E9 K5 J: G3 uMIDI(乐器数字接口)是由一组声音或乐器符号的集合。
6 v$ b% D/ P: t a特点:数据量很小,缺乏重现自然音
& V! M! g( | t" n6 M 四、数字音频压缩标准1.音频压缩方法概述) w' U& V5 J+ @0 l6 l
+ C: d! O. i6 C3 B8 L
压缩编码技术是指用某种方法使数字化信息的编码率降低的技术 音频信号能压缩的基本依据:
. c! O Q1 ?! K; p) e①声音信号中存在大量的冗余度;4 u$ M: \- _! n/ s! v: d
②人的听觉具有强音能抑制同时存在的弱音现象。 音频信号压缩编码的分类:# r2 b6 {* j. B% s
①无损压缩(熵编码)
/ z9 S2 W1 @7 d K4 x! c; E+ p霍夫曼编码、算术编码、行程编码$ t( K. ]& x3 x
②有损压缩% _4 y; I* ?. @* |2 Z! G, s/ ^
波形编码--PCM、DPCM、ADPCM 、子带编码、矢量量化4 O3 t$ r2 ^+ D" o3 A" P
参数编码--LPC
- x: B3 F# D+ ~* @0 O6 Y6 e混合编码--MPLPC、CELP 2.音频压缩技术标准 0 H' G) n' s0 I' B; {
分类 | 标准 | 说明 | 电话语 音质量 | G.711 | 采样8kHz,量化8bit,码率64kbps | G.721 | 采用ADPCM编码,码率32kbps | G.723 | 采用ADPCM有损压缩,码率24kbps | G.728 | 采用LD-CELP压缩技术,码率16kbps | 调幅广 播质量 | G.722 | 采样16kHz,量化14bit,码率224(64)kbps | 高保真 立体声 | MPEG 音频 | 采样44.1kHz,量化16bit,码率705kbps (MPEG三个压缩层次,384-64kbps) |
7 `. |& y1 ?. V* u+ a& B. {' u. u9 w7 Q9 B9 o, G! q8 i" T
五、声卡1.声卡的主要功能, p& b( }0 |- |5 L
声卡是负责录音、播音和声音合成的一种多媒体板卡。其功能包括:
! s4 w4 }5 ?/ @5 t" q①录制、编辑和回放数字音频文件4 N( a: c. ^2 `4 Q4 y {
②控制和混合各声源的音量
3 F# i2 P4 a0 |: V③记录和回放时进行压缩和解压缩
4 o) J0 J3 L6 a8 _. m* r0 B④语音合成技术(朗读文本)7 J3 x2 `2 _3 T/ I$ A: @
⑤具有MIDI接口(乐器数字接口)
7 V. [. @9 A" C0 t/ C% I( w; j: D# O/ h5 y
/ J% h3 `5 T, w1 t+ D$ q) M
2.芯片类型0 J( G: V: j$ R+ p
•CODEC芯片(依赖CPU,价格便宜)8 o% d0 a& Q+ U4 s. B
•数字信号处理器DSP(不依赖CPU) |