1.1.7 泛音列 频谱与音色
6 y8 i# Y3 O6 H1 B9 }9 M! c/ a- }) k/ H0 x. |
(1)泛音列# f/ [0 A9 h) {4 W) _3 M0 P4 K
2 ]* O; U" }# [4 U7 N, ]- G* N% B在音乐声学和音乐理论研究中,为了便于大家理解复合音的构成,常常将基音和泛音按音高顺序排列起来,称之为“泛音列”(serial of overtone或overtones)。如果基音与泛音之间呈整数倍关系,这个音列又称“谐音列”(harmonics)。4 Z x1 w% ]3 e4 h, t s
1 H" H J) h0 w1 ]& _
(2)频谱
) `' S( ~! y4 R) Q" c# }3 J# |. s0 c n |* [+ \8 y$ y
泛音数量、泛音之间的音程关系、以及泛音之间的强度关系,是体现乐器声音特征的三个重要的参量,音乐声学采用一种特定的图形方式将这三个参量之间的相互关系体现出来,这种图形就称为“频谱”(spectrum)或“声谱”(spectrum of sound)。5 X: d; V" W5 [' X3 ^7 l, M
: w8 y- j* z* ?5 y+ n5 E+ U& i典型的频谱是以二维的坐标形式来体现实际声响的泛音列情况:横坐标标示声音中每个泛音的频率,纵坐标标示每个泛音的强度。图1-4所示的是钢琴A音的频谱图。- T( a D- k0 G: v+ @ [
7 s0 ]- ~; }* \3 B
! D( M# d% ^; d5 [! e* U
7 Z. k" Q0 O8 p3 a$ Y |图1-4 钢琴A音的频谱图
' B# d7 V. b% t- g7 F* O, B# x8 I l- q" O8 `# y9 P
& S0 @8 o; ~, T/ d# e2 l6 h
z4 @+ x* b$ G③ 音色9 t# n0 V4 S3 b" Z
m( ^! m: t- s8 |" a# g音色是一种人们对声音的主观心里感觉,是声音的客观物理属性在人们的主观听感中的心理反应。0 ^4 H# l6 `; C9 F6 J4 U
+ g- B" P$ m0 C
人们日常听到的语言和音乐声,都是由许多频率成份(基频加谐频)组合起来的复合音。通常情况下可以根据声音各频率成分的分布特点得到一个综合印象,即音色感觉。- G& w" G F' F+ `: V
* s$ K) d& k/ N
, n# [5 f; m3 U) b/ u) j% b; {$ p, t- n, T2 c
1.2 人耳的听觉特性2 H0 R0 T9 }1 b
+ l7 i. P! j0 w/ `0 H
9 U( {. F5 T+ { Y e" T
2 |$ Z0 D4 Y5 |0 D- g1.2.1 人耳对频率的感知范围
8 K1 B7 `& y. n( e4 |" o: O
' I) B$ Z/ r1 _; q; r) p发声体通过振动能产生声波,但不是所有的声波都能被人们听见,这是由于人耳耳膜与一切物体一样有一定的惯性,它与发声体的振动次数有关。只有频率在20~20000 HZ范围内的声波才能被人听到,因此,该频率范围内的声音称为可闻声。在这个频率范围以外的声波不能引起听觉,频率超过20000HZ的称作超声波,频率低于20HZ的称作次声波。实际上,只有极少部分的人能听到这两端的声音,大部分人的可听频率范围在40 HZ到16000 HZ之间。另外,人耳在不同频率区的听觉灵敏度也是不一样的。如图1-5所示。
( T( k* j' c0 w
5 J7 N$ k1 L$ w. U/ I& d; N9 r9 @/ P+ s* D" e% C
5 w+ O/ @. G7 ~
5 F1 o6 u; I) i# i2 k& ~# Z. k( E3 w5 v& U( k- k9 Q. E
图1-5 人耳对频率的灵敏度/ d! e8 ?) i" k4 \8 a$ {
8 K0 w; q7 p9 T; W3 ` ( x% W6 @) J, i. F0 v/ \
6 I G3 i4 E) `( j2 P: z1.2.2 听阈与痛阈
# K1 k3 ^8 ^# B8 O! Q. {
# a* p5 D5 R0 w6 Z3 K- d+ C2 y: B# ^当声音刚好能够被听见,我们就说这个声音为最低可听界限,这个值就是可听阈。8 g) M, v7 p/ D9 j& D; J5 y
: e; T( M7 P$ ]9 D' c2 L0 V8 l) e在低音量电平时,人耳对于低于500HZ的频率不很灵敏。因此,一个40HZ声音的强度必须比500HZ的声音强度更大,才能达到最低的可听界限。2 G# k/ }$ N; ] w- a. n' _- h
$ O8 u9 [% w. v S) h2 [当一个声音到了使人震耳欲聋的时候,我们就说这个声音达到了最大可听界限,这个值就是疼痛阈。如图1-6所示。0 `$ o ~+ @' j% H4 E0 z; X% u6 S
& Y+ c8 Z6 x" F8 a如果继续增加声强,我们就会感觉到头痛。由于在听到声音与感到头痛之间没有明确的分界线,所以当某些高频声音即使离最大可听界限还有一段距离时,有些人或动物就会对这些声音表现出烦躁不安的神情。因此,疼痛阈是因人而异的。
; I& n* s S. C/ U, _" g- s* J1 D; m
$ I: x1 b! k4 x5 y% V' n U6 h G3 F0 a- V) A5 w% g
9 G1 \# ? y$ Y4 A% h( I; d2 x9 V6 g5 @
图1-6 人耳的听觉范围
- f. d" H" W: y' S- F, t/ V' r# x2 U+ X0 F$ Z+ U( L, N
$ @: g: x; b& W! e2 G' @: D6 X% P/ E, t! y$ i3 @( z% K
1.2.3 人耳的分辨能力
: f, t$ F! K; d* u; {0 k1 ?% q# `2 \2 `
人的听觉对于声音频率变化能察觉到的最小范围称为人耳的频率分辨力,对于1KHz以下的频率为+-3Hz,对于1KHz以上的频率为△F/F=0.003,其中F为某一固定频率,△F为人耳能分辨的频率相对变化值。3 b' s& h# X& m9 q
0 g$ n) O' ^ |. W$ b* K听觉对声音的声压级变化能察觉到的最小变化值称为人耳的声压分辨力,一般为+-2dB。8 }) n0 ?* F: i" K. D7 U8 l/ X
& J( w& T8 M. ^1 ^! ?
! W( B: z6 R/ s) Z7 {4 z0 \ e/ R& j# M
% |1 T4 H8 t9 R9 O; t2 ? c1.2.4 掩蔽效应5 o& p* J3 x4 O* g: k7 P
/ [6 i0 H4 R+ v4 I; _/ q; L
人们在安静环境中能够分辨出轻微的声音,但在嘈杂的环境中却分辨不出轻微的声音,这时需要将轻微的声音增强才能听到。这种一个声音的听阈因另一声音的存在而提高的现象,称为掩蔽效应。
. | Y2 x; q: q0 w6 v5 Y% }! W- E$ z3 d
假设听清声音A的阈值为40dB,若同时又听见声音B,这时由于B的影响使A的阈值提高到52dB,即比原来高12dB。这个例子中,B称为掩蔽声,A称为被掩蔽声。被掩蔽声听阈提高的分贝数称为掩蔽量,即12dB为掩蔽量,52dB称为掩蔽阈。/ D1 Y0 ^+ u7 M1 j5 n- v) Y3 ?
' _- D- K8 Z! b9 T8 f! G& w* E7 @早期的掩蔽研究是从纯音开始的,已经知道声音引起的掩蔽大体决定于声音的强度和频率,低频率的声音能有效地掩蔽高频声,但高频声对低频声的掩蔽作用不大。当两个纯音同时发声时,其掩蔽规律如下:* a: f4 E h: ~( |
4 E2 j4 @2 b* c2 W' ]1 e5 d
a.被掩蔽声的频率越接近掩蔽声,掩蔽量越大,频率相近的纯音掩蔽效果显著。最大掩蔽出现在掩蔽频率附近。
3 A; O b) t! p/ k" C: I" C
+ n# |! G7 T4 d! H/ h9 `7 Zb.掩蔽声的声压级越高,掩蔽量越大,且掩蔽的频率范围越宽。实验表明,若掩蔽声增加10dB,掩蔽阈也增加10dB,两者呈线性关系,且这种关系不受频率影响,既适合于纯音,也适合复合音。
; M( ]" C, W. i7 U# q Y+ u) H; u0 E4 l: {5 w
c.掩蔽声对比其频率低的纯音掩蔽作用小,而对比其频率高的纯音掩蔽作用大,即低频声容易掩蔽高频声,而高频声较难掩蔽低频声。例如:在轰隆轰隆的低频噪声环境下,人们彼此交谈极为困难;而在叮叮当当的高频噪声环境下,虽然感到声音刺耳,但仍能听懂对方的谈话。一个纯音可以被另一个纯音掩蔽,也可以被一个窄带噪声掩蔽。
# ^* n! S5 {. I* a9 c
% ?* b8 t5 y* y$ ~0 r6 ~2 w2 X + d- ]- J7 P3 l8 Q- R7 H
) ]# N, Z* y) u1.2.5 双耳效应
* \1 N4 S# Z9 C; T6 k. t
0 D, x6 S0 D' a4 K: X& ^人耳在头部的两侧,其作用首先表现在接受纯音信号的阈值比单耳阈值约低3dB,这可以理解为双耳共同作用的结果。
& d9 W( s: ~2 l p. ^
$ ?9 S' q5 j0 q7 o* h( H2 g1 C 对强度和频率,双耳的辨别力都高于单耳。用声压级70dB的250Hz、1000Hz和4000Hz三种纯音实验的结果表明,双耳的差别感受性都强于单耳。两只耳朵接收声信号,无论时间、强度或者频谱,都是互不相同的,但是听到的却是一个单一的声像,这个过程就称为双耳融合。双耳听觉大都是在立体声条件的声场中产生的,声音位于周围的环境中,而从耳机中听到的声音位于人的头部。在立体声声场中,确定声源的空间位置称为定向;在用耳机时,确定声源的左右位置称为定位。
4 d# u& ~$ f S- v8 _, D
$ x# C7 @# \! S2 Q3 b/ N 低频信号的定向是以双耳的时间差为依据,而高频信号的定向决定于两耳间的声级差。当波长大于声音从近耳传到远耳的距离时,两耳间的相位差也是有用的声源定向线索。声音绕经头部的路程为22~23cm,所以声音由近耳传到远耳约需660μs。这个时间差相当于频率1.5kHz。因此对更长的波长而言,两耳间将有一个显著的相位差,可作为有效的定向线索。% X& `2 N/ G+ e/ b& U
3 Q3 A! Q7 q& z" v! q: k; O
声源定位的方法是给听音者的两只耳朵送入一定差别的信号,以确定耳间差对定位的影响,即耳间时差对1.3kHz以下的频率最重要,而耳间强度差是高频定位的主要线索。由于人耳的左右对称分布,声源左右移动时,在两耳处引起的声压、时间和相位的差别比较明显,通常可以分辨出水平方向向上5°~15°范围以内的声像移动。但在垂直方向上,可能声像移动达到60°以上才能分辨出来。剧场的观众厅扩声系统中,扬声器置于台口上方,就是因为考虑到人耳左右水平方向的分辨能力远大于上下垂直方向
) A. \4 [& m5 M( e6 j) l
7 B+ |+ r% M5 ?4 [ 双耳效应在厅堂声学设计中占有重要地位,特别是在录音和扩声方面,很多声学参数都需要考虑这一因素。立体声系统就是根据人的双耳效应而发展起来的。
y; x N! z8 N# T; K3 S; z8 F" n: Z' E8 F1 M% w3 R. D
1 P" a0 A E: g# X
3 M# H5 h9 k' V$ i9 t
1.2.6 哈斯效应3 W7 ~9 |$ E& k& H) i7 N; ~
0 W" K/ D/ j, |% T当一个声场中两个声源(两个声源发出的声音是同一个音频信号)的声音传入人耳的时间差在50ms以内时,人耳不能明显辨别出两个声源的方位。人耳的听觉感受是:哪一个声源的声音首先传入人耳,那么人的听觉感觉就是全部声音都是从这个方位传来的。人耳的这种先入为主的聆听感觉特性,称为“哈斯(Hass)效应”。+ H4 O' o2 V) h0 C8 k" T" @( x
( n( k5 W0 i- ^
当两个声音到达人耳的时间差不超过20ms时,人的听觉不会发现实际上存在有两个声源。当两个声源在方位上较接近时,时间差可达30ms而不被人的听觉所觉察。当时间差增加到35~50ms时,后到达人耳的声音将被感觉到,但此时人的听觉仍不能把两个声音分开。当时间差超过50ms时,若后到达的声音有足够的声级则会干扰先到的声音,形成回音效果。
- v" b2 L" L$ Q1 c: W: p6 b/ [- i1 |' T! {1 p m
图1-7所示为哈斯效应的几种情况。图中A、B声源采用相同的声源信号。
6 T ~, v, D( r) V1 X
* G8 w2 F( A7 q- f: b2 W! X7 N
( V% W/ S5 \9 ]
7 }& G# k; b3 s+ R* ~( H7 P9 R& ?1 |) y2 F3 n0 d/ P4 t
( H- h. m- L( w# E! [
1 J* O7 D( `) j, p
* _. B3 x" {: z* N0 U图1-7 哈斯效应示意图- v" P: T, [( T- r9 q$ l: K0 A$ G
7 l$ m0 O: t2 @$ O7 A( N
$ z- M5 g9 G* M: R, F6 u
1 r, p# S. Z6 u% G图(a)中,声源A和B距离人耳的距离相同,人不能明显地辨别出两个声源的准确方位,主观感觉是声音来自两个声源之间,增加了空间感,人们称之为假立体声。, B& O) a# C' }4 l$ G" t% O3 y' i
! H! M, v9 E0 }: s, v. @7 M& c
图(b)中,人听音的位置距A声源近,距离B声源远,听到A声源声音大,听到B声源声音小。但是,人们的心理感觉却是只有一个A声源的声音,而没有感觉到B声源的存在,即哪个声源声音强,人们就感觉全部声音都是由这个声源传出来的。6 C X$ ^! ^' G% @
$ `. a, l/ j' ^# U7 g图(c)中,人距离B声源近,距A声源远,感觉到全部声音都是B声源发出的,而忽略了A声源的存在。如果将B声源切断,人们才会发现A声源声音的存在,不过由于A声源距离人较远,听到的声音小一些。如果将A声源切断,仍然感觉到声音是由B声源发出的,不过听到的声音由于切断了A声源而变小了,其感觉的方位并没有改变。
: n0 t+ {: L: d
e1 v) I; f9 @4 [$ K, h9 p a1 B图(d)中,听音者距离A声源很近,但A声源加入延时处理后,B声源的信号先送入人耳,人感觉声源为B方向。
' X1 ^: T. J1 P% q- X* ^
3 `; f" e2 ]; V0 a, B! C9 I
@* N6 l6 I3 `3 `
- r4 J; I: W* \$ I& Y. X9 D1.2.7 多普勒效应0 [& H1 e( M5 L% \4 e. v; X- `4 d
W: ^" D {; L: r! Y
当听音者与声源做相向运动(即互相靠近)时,接收到的信号波长会在瞬间变短。由于波长与频率成反比关系,波长变短,频率就会升高,所以感觉声音在变高;当听音者与声源做反向运动(即互相远离)时,波长会在瞬间变长,同理频率就会降低,所以感觉声音在变低。1842年奥地利物理学家多普勒(C.Doppler)首先从理论上解释了这种现象,所以称这种现象为多普勒效应。比如,当我们乘火车时,听到对面疾驶而来的火车鸣笛声,先是升高,然后又随着车子的驶过而降低。( M& s# k6 Q9 Q4 m) [
1 v% t) y2 E$ R2 v" p" o ! @4 t# R, i5 k* @! \# |6 P! H; \ D
* a, s) v3 A7 V' w0 {$ v1.2.8 鸡尾酒会效应
0 T% x7 M* P& A" ^- F* y3 \5 @- U! h7 Y0 Y1 e( c! }
指人耳具有“过滤”或选听功能:能够自动滤掉不想听的声音,专门接收想听的声音信息。比如,在人声嘈杂的饭馆里吃饭,周围很多人都在说话,而你却可以只听见同桌朋友的谈话,对周围声响“充而不闻”;但如果你用录音机录下当时在场的所有声音,待重新播放时,你会听到你和你朋友的谈话已经淹没在周围嘈杂的声响之中,根本无法分辨谁在讲话。这是因为录音机没有人耳的“滤波功能”所致。声学上把这种现象称为“鸡尾酒会效应”。4 d: {1 D* {) e3 s
" C H. t3 L: `2 e2 t, G. q1 Z " P' L7 V4 P$ ~8 ^: |$ b
4 n& a, q H7 X
1.3 室内声音的构成. q, O; V/ J5 U3 ]) P! D, h
1 {, Z) f3 m# C4 k
# |# o/ ?% h3 F0 f: r9 \) o
" A: ?! L* J3 n" V发声体在闭室内振动,所发出的声波在室内空间形成复杂的声场。声场中某一位置上听到的声音由三部分组成:直达声、近次反射声(又称早期反射声)和混响声(又称多次反射声),如图1-8所示。
, I' _. Q8 B0 J8 Y
9 x- y7 }! F& C" _" U
% J2 h# J5 H( @+ R: |/ g D0 s
* D) L/ Q |* v8 _! D$ B
- A$ Q3 S7 B! x4 u) _, _- S
$ Z. y! p7 O$ J( ?( o* |1 n- R图1-8 室内声音的组成
0 N% Q9 S( W" ?9 @" d1 K7 W+ w
# a# A B, i( E0 z+ m * q( n& @. j0 `5 z# \: u/ ~" N
3 A8 X3 U4 z8 S8 o3 b
1.3.1 直达声' i. W4 X) A8 Z% P; A* {, Z
1 y5 n9 K, u: a3 f) u: R 直达声指从声源直接传播到听音点的声音,其传播路径是从声源到该点的直线段。在传播过程中直达声不受室内界面的影响,符合平方反比定律,即距离每增加1倍,声压级下降6dB。声源除了向听音位置按直线方向传播声音以外,同时也向四面八方辐射,这些辐射声波遇到墙面或其他较大的障碍物时,一部分被反射,一部分被吸收,而这些反射声在遇到障碍物时又会发生第二次、第三次……反射与吸收的过程,直至能量被吸收耗尽。这样在听音位置上所接收到的声音除了直达声以外还有一系列的反射声。图1-9所示为脉冲声在闭室内的响应曲线。( l4 d+ Y/ [- O4 Y: u0 t: U
* D+ R7 s) f8 K2 F5 Q; h" l
& p" i! }1 ?4 r6 r) @7 @; S6 H1 u# R* k# l$ L c
, j b/ z8 G3 v' [: t' @
: p; z2 \+ i+ M/ S6 M' S3 G2 Z' J # H( `$ ~8 S* b2 p# Q
4 L# B" i4 {8 W2 s5 B
图1-9 脉冲声在闭室内的响应曲线
+ K: G4 ? z7 t( _# S4 v/ d6 B3 O+ X( W+ x4 V2 z4 p9 M. g' D, M2 |3 Y
8 }" B2 ?0 |! { r, x2 V9 P
! c$ |2 X) | w- j
1.3.2 早期反射声. m J& t/ B+ S( g
5 _* a4 k$ b/ y* F. c2 Q早期反射声指相对直达声延迟50ms以内到达的反射声。早期反射声到达较早,经过反射次数较少,在响应图上间隔较大且声压级也较高。' ?! \. d3 R' j) j
$ ?: q$ W/ ~# J5 E# r
由于哈斯效应,延时在50ms内的反射声难以和直达声分开,不会互相干扰。早期反射声有助于加强直达声,特别是大厅内来自侧墙的反射声,对声音的空间感和声音洪亮感起重要作用。在大型厅堂中,可依靠早期反射声使声场均匀。) W, X# u- W6 S; |# Z$ q8 J
+ @: Q4 n0 n. ] g( j1 y: s+ d到达听者的第一次反射声与直达声的时间间隔,称作初始时间间隙(或称作预延时时间),与闭室大小有关,对声音的亲切感起主要作用。. }! ~1 {2 ^# `' ]/ x
2 m: B8 v' u' X1 M. w, Z
! |- C: f6 ]; J' I4 M: ^8 _1 z
% @3 J* E7 w9 h2 R6 q1.3.3 混响声
$ P. R% U$ H5 C, d2 Q
( Z9 P: p5 B7 T3 @: w! z: K3 l混响声是室内继早期反射声之后的一系列密集而不可辨认的反射声的总体。混响声对听感的影响主要有以下几个方面:% c9 z) V3 X9 W/ F5 F
3 [: C* f! o7 z4 f, q6 T# E: T◆ 提高了听感的响度;9 T3 W! {( `' |3 V; T# Z9 G2 `
1 w- ?8 n) z9 F9 g" H! X
◆ 给人以温暖感和力度感;
. N' X/ D5 S0 M5 u' L1 |. E# y w7 p% U' L' u6 m
◆ 影响清晰度、融合度以及层次感;
7 i/ h1 R1 A5 b8 v: L
* `% S2 I& e) O3 s4 E◆ 提高声音的丰满度;
, r d- S0 h# ~! ~3 H8 I) S1 H# `; p
◆ 对环境感有重要影响,并对判断与声源的距离起一定作用。: x A! U& M( z$ L. y7 k
7 r- H: P% |* w5 b
从本质上讲,混响声与早期反射声一样都是经房间修饰了的非直达声。不同的是,混响声通常只能在封闭空间中形成,并且主要在混响场部分起主要作用,而在任何空间,只要有反射面存在,反射声的获得总是可能的。 |