//Logo Image
作者:楊哲彰(2005-04-04)﹔推薦:徐業良(2005-04-04)

人耳聽覺現象之基礎探討

本文將引述部分相關聲學研究,對於人耳聽覺現象及相關聲學名詞作一基礎探討。

1.         音壓之基本計算

聲音的強度即聲波於空氣中之壓力,以「音壓(sound pressure level, SPL)」表示,通常以dyne/cm2為度量單位,而人耳對於感覺聲音的強度則稱為「響度(loudness)」。所謂聲音的「分貝(decibel, dB)」值是較常用來衡量聲音強度大小之單位,但dB值代表的是“兩個音壓的相對強度”,因此以dB值衡量音壓之大小時,必須訂出一個相對的「基準音壓」SPLref。此基準音壓乃人耳的「聽覺下限(threshold of hearing)」,即人耳所能夠感覺到聲音存在的最小音壓,雖然每個人的聽覺下限不盡相同,但一般平均定為SPLref=0.0002 dyne/cm2,且由於人耳聽覺音壓變化的響應範圍相當廣,因此dB值以對數方式計算,如式(1)所示:

                                                                                 (1)

根據式(1),當SPL0.0002 dyne/cm2時,dB SPL值為00dB即為人耳的聽覺下限。聽覺的「疲勞限(threshold of feeling)」定義為人在接受聲波的半數時間中,造成聽覺不適的音壓,這個音壓在200Hz10kHz範圍內約為118dB。「疼痛限(threshold of pain)」定義為人在接受聽覺的半數時間內,造成聽覺疼痛的音壓,在200Hz10kHz範圍內約為140dB

2.         聽覺響度特性

1說明日常生活中聲音強度與頻率的分佈情形(橫座標為頻率,縱座標為dB SPL),圖中大略可看出人們日常對話音量的動態範圍(dynamic range)約為30dB70dB之間,聆聽音樂會時約為20dB100dB之範圍內。圖中最外圍實心線所構成的區域代表人耳的聽覺頻率範圍,及音壓上下限。對正常的年輕人而言,人耳聽覺頻率範圍大約可由20Hz20KHz,但實際上人耳對於16KHz以上高頻聲波的響應已經相當不靈敏,特別是中老年人聽覺於頻率上限部份的靈敏度衰減很多,圖2顯示不同年齡層,其聽覺下限門檻的變異情形。

1. 日常生活中聲音強度與頻率的分布[Eargle, 2003]

2. 不同年齡層的聽下限門檻[Zwicker and Fastl, 1999]

由圖1與圖2也可看出人耳聽覺響應呈現非線性,對於不同頻率的聲音,人耳的聽覺下限與疲勞限也有差異。例如於低音壓強度時,對於1KHz5KHz之間的聲音,比起其他頻帶的聲音感度較靈敏,對於4KHz的聲音最為靈敏,具備最低的聽覺下限,甚至有些人可低於0 dB。人耳聽覺對於20Hz200Hz之頻帶內的低頻聲音,頻率愈低則感度愈低。為了更詳細說明人耳聽覺響應非線性之特性,圖3著名的“Fletcher-Munson (or Robinson-Dadson) equal loudness contour”用來說明此現象,此圖中的各個等高線,代表“相對於1KHz純音調(pure tone)的聲波,人耳感覺到相同響度的dB SPL音壓強度分佈”。例如在較高的音壓下,1KHz聲音於110dB SPL時人耳聽起來的音量大小,會同等於50Hz聲音於約120dB SPL,或10KHz聲音於約118dB SPL;又如在較低的音壓下,1KHz50dB SPL時人耳聽起來的音量大小,會同等於50Hz聲音於約75dB SPL,或10KHz聲音於約55dB SPL

3. Fletcher-Munson (or Robinson-Dadson) equal loudness contour [Huber and Runstein, 2001]

3.         人耳主觀聽覺的變異

聲音強度的變化會造成人耳聽覺「主觀音準(subjective pitch)」的些微偏移。Terhardt (1979)的實驗結果如圖4所示,圖中右邊每個“cent”代表百分之一個半音階(1個八度音程包含12個半音階),當聲音頻於在2KHz以上時,音壓增加時,主觀音準會趨向提高,若低於2KHz時,則會得到相反的效應。例如當1kHz的聲音從60dB SPL提高至90dB SPL時,人耳的聽覺會感覺到音準稍微降低約10%個半音階。

4. 純音調(pure tone)聲音於不同音壓下的主觀音準偏移[Eargle, 2003]

聲學上「遮蔽效應(masking)」這個名詞,則是指一種聲音可聽見的極限音量會因為另一種聲音存在而提高,簡言之,兩個聲音同時存在時,響度較大的聲音會傾向於遮蔽響度較小的聲音。聲音的遮蔽效應在頻率相近的聲音之間更為明顯,例如4KHz的聲音對於遮蔽3.5KHz聲音的效應,會比遮蔽1KHz聲音的效應來得明顯。聲音的遮蔽效應對於數位音訊處理技術上有相當重要的價值,現在絕大多數的數位音訊編碼壓縮技術都採行「感覺編碼(perceptual coding)」,即根據遮蔽效應,將可能被遮蔽而使人耳不易察覺到,或甚至根本聽不到的部分音訊刪除,以降低資料量。

一個短時間的瞬發(impulsive)聲響以及一個相同音壓與頻率的連續聲響,在人的聽覺上會產生不同的主觀響度。圖5為以相同音壓的500Hz聲音為例,說明瞬發聲響與連續聲響的相對音壓差異,並顯示在不同的瞬發時間長度下,會呈現不同的相對音壓值。例如瞬發聲響長度為0.002秒時,此聲波的主觀響度會低於連續聲響約17dB。而瞬發時間長度愈長,則相對音壓差則愈小,當瞬發時間高過0.1秒後,瞬發聲響與連續聲響的差距就變得相當小。

5. 不同時間長度的瞬發聲響之主觀響度變異[Eargle, 2003]

4.         方位感的判斷

人耳聽覺除了對於音壓與頻率具有不同的響應之外,聽力正常的雙耳聽覺,可判斷聲音的方位與距離,主要依據相互聽覺強度差異(Inter-aural intensity difference)、相互聲波到達時間差異(Inter-aural arrival-time difference)、以及外耳廓效應(Effect of the pinna)等三個現象。

判斷聲音之「方位感(localization)」主要依據左右耳所接收的聲音強度以及時間差異而定,例如當發聲音源由右方產生,聲音會先到達右耳,而由於人頭對於聲波傳遞形成聲學障蔽(acoustic shadow),因此到達左耳的聲音為環境的反射音,所接收的聲音強度勢必較右耳低,且接收到聲音的時間也略晚於右耳,因此聽覺系統便會對此差異作出聲音方位的判斷。但是在頻率較低的聲音下,人耳聽覺對於聲音方位之判斷則較為遲鈍,例如在空曠室外時,往往不容易判斷出打雷聲的正確方位,一方面由於對於低頻聲音感度較低,另一方面則起因於低頻聲音的波長較長,人頭的障蔽效應此時變得較不明顯,如圖6所示,對於低頻聲音方位之判斷僅能依據左右耳接收聲波的到達時間差而定。

6. 高頻與低頻聲波下的人頭障蔽效應[Eargle, 2003]

若左右耳接收到相同的音壓時,大腦將判斷聲音來自於該方位的於正中間處,例如當以耳機聆聽單聲道錄音(MONO)的音樂時,由於來自左右耳機單體的聲音完全相同,會感覺所有聲音都變點音源,出現在頭內的正中心處,即兩耳連線之中點。

耳廓(pinna)的形狀也能輔助人耳聽覺系統辨別方位。如圖7所示,耳廓內主要有兩個突起的脊線(ridge),這兩個耳廓脊線的形狀具有反射聲波的效果,使來自不同方位的聲音進入耳道(ear canal)的時間差產生些微的時間差。當戴上防音耳罩時,由於耳廓的功能被抑制,加上防音耳罩本身的聲衰減特性,將減低聲音方位感的判斷能力。

7. 耳廓(pinna)內部脊線(ridges)[Huber and Runstein, 2001]

5.         空間感的判斷

人耳的聽覺系統除了判斷聲音的方位之外,也可以感受聲音於空間中的空間感。空間中的發聲音源,整個聲音的傳遞過程可分為「直接音(direct sound)」、「早期反射(early reflection)」、「迴響(reverberation)」等三個部分。

如圖8所示,當物體於空間中發聲後,有一小部分的聲波會直接傳達至耳朵,此即直接音,而其他大部分的聲音,被非直接傳達至耳朵,而是在空間中經過數次的反射後才到達耳朵,此為早期反射。聲音若經過多次的反射,以及空間邊界的擴散與吸收後,呈現均勻、來自各個方向而微音量的聲音延遲,是為迴響。人在空間中,首先會聽到直接音,接著是早期反射,最後再伴隨聲音迴響。

直接音對於人耳聽覺而言,可判斷聲音音源的方位、距離、音壓大小、以及聲音的真實音色(timbre)特質。早期反射音約在耳朵接收到直接音50m秒內到達,此部分的聲音主要影響人耳對於空間大小,聲音形體感的判斷。在耳朵接收到直接音50m秒後,聲波經空間的多重反射與吸收,此時聲波來自於所有方向,此細微能量的聲波構成聲音迴響,人耳無法由聲音迴響判斷音源方位與距離,但迴響特性提供空間的“環境特性”,例如空間邊界(牆面與天花板)材質,以及聲音的細微泛音(overtone)結構。人的聽覺系統會依據直接音、早期反射、與迴響之特性,判斷出發聲音源的聲音特質,以及所處的空間特性。

8. 音源於空間中之傳遞[Huber and Runstein, 2001]

參考資料

Eargle, J., 2003. Handbook of Recording Engineering 4th Edition, Kluwer Academic Publishers.

Huber, D. M., Runstein, R. E., 2001. Modern Recording Techniques 5th Edition, Focal Press.

Zwicker, E., Fastl, H., 1999. Psychoacoustics Facts and Models 2nd Updated Edition, Springer.