關(guān)于語(yǔ)言清晰度(可理解性)的深入洞察(二)
來(lái)源:同創(chuàng)音頻 編輯:ZZZ 2024-06-18 09:42:23 加入收藏
在上一期的探討中,我們深入了解了語(yǔ)音產(chǎn)生的原理,并分享了關(guān)于錄擴(kuò)音的實(shí)用建議。本期,我們將繼續(xù)這一旅程,聚焦于語(yǔ)音頻譜、共振峰以及影響語(yǔ)言清晰度的關(guān)鍵因素,以期為大家呈現(xiàn)更全面的語(yǔ)言清晰度(可理解性)洞察。
語(yǔ)音頻譜
語(yǔ)音的頻譜覆蓋了可聽(tīng)頻譜的廣泛區(qū)域,其中元音 和輔音 構(gòu)成了語(yǔ)音的基本元素。元音 由聲帶振動(dòng)產(chǎn)生,經(jīng)過(guò)聲腔的精細(xì)過(guò)濾,賦予聲音獨(dú)特的音色。而輔音 則是由空氣在喉嚨和口腔中的流動(dòng),特別是舌頭和嘴唇的精細(xì)操作產(chǎn)生的。
元音的特征,即使是在講悄悄話中也能被識(shí)別,這是因?yàn)樾纬刹煌舻目涨唤Y(jié)構(gòu)依然影響著空氣的流動(dòng)。男性復(fù)雜語(yǔ)音音調(diào)的基頻通常在100-120 Hz之間,女性則高出一個(gè)八度,而兒童則更高。輔音則通常位于500 Hz以上的高頻區(qū)域,對(duì)語(yǔ)音的清晰度至關(guān)重要。
共振峰
在語(yǔ)音中,共振峰是另一個(gè)重要的概念。它們是通過(guò)聲道中空腔的共振“調(diào)諧”而產(chǎn)生的,
如果你聽(tīng)兩個(gè)人以相同的音高說(shuō)或唱同一個(gè)元音,那么在這兩種情況下,元音可能是相同的。然而,任何兩種聲音都不一定產(chǎn)生完全相同的頻譜。共振峰為元音提供了可感知的特征,每個(gè)人獨(dú)特的聲道結(jié)構(gòu)使得共振峰具有個(gè)體差異,這也是我們能夠區(qū)分不同說(shuō)話者聲音的原因。
影響語(yǔ)言清晰度的關(guān)鍵因素
一、輔音的重要性:
在漢語(yǔ)、泰語(yǔ)等聲調(diào)語(yǔ)言中,語(yǔ)調(diào)或基本頻率承載著意義。而在非聲調(diào)語(yǔ)言中,如英語(yǔ)、西班牙語(yǔ)和日語(yǔ),元音和輔音的變化則是區(qū)分單詞的關(guān)鍵。其中,輔音的重要性尤為突出。輔音主要位于高頻區(qū)域,對(duì)于語(yǔ)言的清晰度具有決定性作用。
二、頻率的重要性:
西方語(yǔ)音中,頻率的重要性如下圖所示:
在圖中我們可以看到,2kHz左右的頻帶是感知清晰度方面最重要的頻率范圍。因?yàn)榇蠖鄶?shù)輔音都在這個(gè)頻帶中。
(Ref: N.R. French & J.C. Steinberg: Factors governing the intelligibility of speech sounds. JASA vol. 19, No 1, 1947).
對(duì)語(yǔ)音信號(hào)進(jìn)行高通或低通濾波的實(shí)驗(yàn)也驗(yàn)證了這一點(diǎn)。使用20 Hz的高通濾波器,語(yǔ)音可以100%被理解,這是因?yàn)橥暾恼Z(yǔ)音頻譜并未被過(guò)濾。當(dāng)高通濾波器切斷500Hz以下的信號(hào)時(shí),因?yàn)榧词挂徊糠终Z(yǔ)音能量被刪除,語(yǔ)音的可理解性?xún)H降低5%;但當(dāng)低通濾波器在1kHz處切斷時(shí),可理解性已大幅下降至40%以下。這再次強(qiáng)調(diào)了1kHz至4kHz頻率范圍對(duì)語(yǔ)音清晰度的重要性。
三、背景噪聲:
背景噪聲是影響語(yǔ)音清晰度的另一重要因素。在語(yǔ)音系統(tǒng)中,除了語(yǔ)音本身之外的所有信號(hào)都可以被認(rèn)為是噪聲。因此,在禮堂或教室里,空調(diào)和其他嘈雜的設(shè)備運(yùn)行時(shí)都會(huì)使語(yǔ)音變得不那么清晰。此外,其他人的存在也會(huì)產(chǎn)生噪音。在電視或電影音效中,對(duì)白的電平與背景音樂(lè)或氛圍聲音電平之間的關(guān)系問(wèn)題也是非常重要的。
在這個(gè)圖表中,語(yǔ)音可理解度是根據(jù)信噪比(S/N)繪制的。較低的曲線表明,即使信噪比為負(fù),也就是說(shuō)噪聲比語(yǔ)音水平高10 dB,語(yǔ)音仍然可以在一定程度上被理解。但在任何情況下,最佳的感知語(yǔ)音水平約為60 dB或20 μPa。
通過(guò)大量的研究,總的來(lái)說(shuō)結(jié)果表明:
1. 當(dāng)背景噪音低于40dBA時(shí),最佳語(yǔ)音電平不變。
2. 當(dāng)背景噪聲電平大于40 dB(A)時(shí),最佳語(yǔ)音電平或信噪比保持在+15 dB(A)左右的電平。
3. 在信噪比足夠好的情況下,聽(tīng)力可理解性的難度隨著語(yǔ)音電平的增加而增加,使可理解性接近完美。
此外,1kHz-4kHz的頻率范圍應(yīng)該“保持清晰”。例如,當(dāng)添加音樂(lè)在影視作品中作為背景時(shí),參量均衡器在該頻率范圍內(nèi)衰減音樂(lè)5-10 dB,這樣將會(huì)提高語(yǔ)音對(duì)白的可理解性。
四、混響:
在談?wù)撜Z(yǔ)音清晰度時(shí),混響也被視為一種“噪音”。雖然輕微的混響可以支持講話,但一旦輔音被抹去,可理解性將大幅下降。因此,在錄音和擴(kuò)聲過(guò)程中,需要仔細(xì)控制混響的影響。
通過(guò)深入了解語(yǔ)音頻譜、共振峰以及影響語(yǔ)言清晰度的關(guān)鍵因素,我們可以更好地掌握如何確保在各種場(chǎng)景下維持高質(zhì)量的語(yǔ)音清晰度。無(wú)論是面對(duì)面交流還是通過(guò)擴(kuò)聲系統(tǒng)傳播聲音,這些洞察都將為我們提供寶貴的指導(dǎo)。
評(píng)論comment