马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
+ |( d. `: y p) z4 {[tr][td]一、声音的基本概念 声音是通过一定介质传播的连续的波。
- ?' i8 M7 O$ Q" d' J# S
) s/ Y# b" d) T0 q重要指标:
8 ]% g t( \5 m7 f$ Q8 ?4 T1.振幅:音量的大小$ J! N$ }; K$ `, J5 F
2.周期:重复出现的时间间隔5 {) v3 A( D5 m
3.频率:指信号每秒钟变化的次数
声音按频率分类: ! r# _5 @7 h+ m" D7 a
上图 声音的频率(语音信号频率范围:300Hz-3kHz)5 g8 p+ N8 w! n& |9 {
声音的传播携带了信息,它是人类传播信息的一种主要媒体。 声音的三种类型:
! a( I7 }8 F" H; ~; g3 f1.波形声音:包含了所有声音形式7 ? m: z& p* E* }' I
2.语音:不仅是波形声音,而且还有丰富的语言内涵(抽象→提取特征→意义理解)
) ]+ j1 J2 Q- [+ x7 _: ?3. 音乐:与语音相比,形式更规范。音乐是符号化的声音。 二、声音的数字化1.声音信号的类型
7 z: d2 `; H* X, g2 }" j+ f•模拟信号(自然界、物理)
8 T s: f- K1 j) u/ E5 ?; B•数字信号(计算机)
" \: T1 V- e1 T5 E# f. m! k2.声音数字化过程
" O1 A7 ?- H6 G- p& T V& b- q3.声音数字化过程示意图 4.声音数字化三要素 ! V' \; B8 r) s2 w5 c$ u8 H# M7 ]9 a
采样频率 | 量化位数 | 声道数 | 每秒钟抽取声波幅度样本的次数 | 每个采样点用多少二进制位表示数据范围 | 使用声音通道的个数 | 采样频率越高 声音质量越好 数据量也越大 | 量化位数越多 音质越好 数据量也越大 | 立体声比单声道的表现力丰富,但数据量翻倍 | 11.025kHz 22.05 kHz 44.1 kHz | 8位=256 16位=65536 | 单声道 立体声 | 3 @6 }8 Z5 C! t: X* c
5.声音数字化的数据量 音频数据量=采样频率×量化位数×声道数/8(字节/秒) % |( @4 }% S5 ^3 M# P
采样频率 (kHz) | 量化位数 (bit) | 数据量(KB/s) | 单声道 | 立体声 | 11.025 | 8 | 10.77 | 21.35 | 16 | 21.53 | 43.07 | 22.05 | 8 | 21.53 | 43.07 | 16 | 43.07 | 86.13 | 44.1 | 8 | 43.07 | 86.13 | 16 | 86.13 | 172.27 |
0 y: F6 ]# s" i2 @- u% V
5 {) D' Z6 S. S, R: e" w0 x三、音频的文件格式 1.WAV文件0 U: y; \5 G# }" y/ L' r6 h$ k
WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。1 m8 T0 J4 J' I# Y
特点:声音层次丰富,还原音质好 2.MP3文件5 B6 r3 ?7 m1 h9 \# ?; n
MP3(MPEG Audio layer3)是一种按MPEG标准的音频压缩技术制作的音频文件。' A* `, g- J" Z( u" u+ Y. H- }' U7 c
特点:高压缩比(11:1),优美音质 3.WMA文件
' B( {+ X i4 p# {9 J0 f# @* M3 _, aWMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。
- J5 O. K5 r: [; p- p" e) f5 T特点:压缩到MP3一半 4.MIDI文件2 n9 k F$ g/ S$ w! [& ]: \
MIDI(乐器数字接口)是由一组声音或乐器符号的集合。# P5 `1 B( A8 u* z4 j" k5 I) f) c
特点:数据量很小,缺乏重现自然音
# [) w5 T, U3 P# L4 g5 H5 b7 t 四、数字音频压缩标准1.音频压缩方法概述
* {; k+ ], J3 l0 w$ o% }) X/ \3 A- z/ ~+ K
压缩编码技术是指用某种方法使数字化信息的编码率降低的技术 音频信号能压缩的基本依据:
+ M4 c4 ], E8 p; _& L# M①声音信号中存在大量的冗余度;
, I3 F( p) ]/ z# K K( h) {②人的听觉具有强音能抑制同时存在的弱音现象。 音频信号压缩编码的分类:* e6 s, Q0 R! e+ x& T% M7 F
①无损压缩(熵编码)
, ]0 w, U: N- W! b3 U2 C) T霍夫曼编码、算术编码、行程编码7 ^! e; d& a- L
②有损压缩7 Z1 P& w2 E' u3 g
波形编码--PCM、DPCM、ADPCM 、子带编码、矢量量化
$ I7 L: w" m1 }! ^0 y参数编码--LPC
( Y" K8 l) W5 ^6 _8 E混合编码--MPLPC、CELP 2.音频压缩技术标准
2 y0 q [0 R/ v分类 | 标准 | 说明 | 电话语 音质量 | G.711 | 采样8kHz,量化8bit,码率64kbps | G.721 | 采用ADPCM编码,码率32kbps | G.723 | 采用ADPCM有损压缩,码率24kbps | G.728 | 采用LD-CELP压缩技术,码率16kbps | 调幅广 播质量 | G.722 | 采样16kHz,量化14bit,码率224(64)kbps | 高保真 立体声 | MPEG 音频 | 采样44.1kHz,量化16bit,码率705kbps (MPEG三个压缩层次,384-64kbps) |
4 s! U9 b9 a1 Z8 `3 x$ A6 G7 H2 z5 X4 K
五、声卡1.声卡的主要功能8 r2 o6 M$ s8 \6 p
声卡是负责录音、播音和声音合成的一种多媒体板卡。其功能包括:
' Y% d! W0 f0 K& F# G8 m8 t①录制、编辑和回放数字音频文件, T! O* T( }7 B
②控制和混合各声源的音量( d6 I k& H: N) D2 z9 a6 _+ Y
③记录和回放时进行压缩和解压缩
8 M) E# u- i) @. q4 [% r% N④语音合成技术(朗读文本)( p* O+ ]7 P. U) B. ^8 g; w
⑤具有MIDI接口(乐器数字接口)
( ?* q f' @# y" Q5 F+ M; u/ T3 P
- ]4 V, T8 Q/ n0 g3 i
2.芯片类型5 }* I; j: @" n7 h5 W9 c2 G
•CODEC芯片(依赖CPU,价格便宜)
# q. B9 L; U# Q6 S9 y$ q( B•数字信号处理器DSP(不依赖CPU) |