關(guān)于語言清晰度(可理解性)的深入洞察(三)
來源:同創(chuàng)音頻 編輯:ZZZ 2024-06-26 08:52:38 加入收藏
在上一期中,我們深入探討了語音頻譜、共振峰以及影響語言清晰度的關(guān)鍵因素。本期,我們將聚焦聲場(chǎng)對(duì)語言清晰度的影響,并為大家總結(jié)麥克風(fēng)放置的實(shí)用規(guī)則。
關(guān)于聲場(chǎng)對(duì)語言清晰度的影響
在探討聲場(chǎng)對(duì)語言清晰度的影響時(shí),一個(gè)關(guān)鍵的觀察點(diǎn)是聲音的指向性,即聲音在不同方向上傳播的強(qiáng)度和特性。通過精心設(shè)計(jì)的實(shí)驗(yàn)和測(cè)量,我們可以觀察到聲場(chǎng)中的諸多細(xì)節(jié),這些細(xì)節(jié)對(duì)于理解如何捕捉和傳達(dá)清晰的語言至關(guān)重要。
當(dāng)發(fā)言人發(fā)言時(shí),其聲音不僅受到周圍聲場(chǎng)環(huán)境的影響,還受到人的頭部和身體的影響。這種影響在多個(gè)維度上展現(xiàn),包括指向性、距離與方向、以及頭部和胸部的反射等。
下面是人類說話者在垂直和水平平面上的極坐標(biāo)圖。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
首先,值得注意的是,當(dāng)我們繪制出人類說話者在垂直和水平平面上的極坐標(biāo)圖時(shí),可以發(fā)現(xiàn)一個(gè)明顯的現(xiàn)象:電平在經(jīng)過A加權(quán)后,男性和女性在正面和背面之間的差值大約為7dB。這意味著聲音在直接面對(duì)的方向上最為強(qiáng)烈,而在背后則相對(duì)較弱。
然而,這一數(shù)據(jù)并沒有揭示出關(guān)于頻率相關(guān)性的全部信息。事實(shí)上,高頻聲音在背面的衰減比低頻聲音更為顯著。這一發(fā)現(xiàn)對(duì)于麥克風(fēng)的選擇和放置位置具有指導(dǎo)意義,因?yàn)樗馕吨鵀榱瞬蹲礁嗟母哳l細(xì)節(jié),麥克風(fēng)需要更加靠近說話者的正面。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
從上圖可以看出,方向性從大約1kHz及以上增加。將這一事實(shí)與1kHz以上頻率的重要性相結(jié)合,很明顯,當(dāng)在人前面而不是在人后面拾音時(shí),可以獲得更高的可懂度。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
此外,在垂直面上,我們注意到一個(gè)有趣的細(xì)節(jié):與其他方向相比,330°方向(大致指向胸部區(qū)域)的水平面更高。這并非偶然,而是由于聲音從胸部反射出來所導(dǎo)致的。這種反射不僅增強(qiáng)了該方向上的聲音強(qiáng)度,還可能對(duì)頻譜產(chǎn)生一定的影響,尤其是在低頻部分。
距離與方向
由于并非所有麥克風(fēng)都放置在距離講話者1米的地方,因此了解當(dāng)我們靠近聲源時(shí)會(huì)發(fā)生什么是很有趣的。
下圖顯示了在給定方向上1米處記錄的語音頻譜的偏差。角度(+45度、0度和-45度)在垂直平面內(nèi)。這些結(jié)果是10個(gè)談話者的平均值。
三個(gè)圖中的每條線分別顯示了80厘米、40厘米、20厘米和10厘米處的偏差。
如果在改變方向和距離時(shí)頻譜沒有變化,所有曲線都將是直線,但隨著我們離談話者越來越近,偏差會(huì)增加。
下圖顯示了從軸向平面向上45°的測(cè)量位置。與這里的偏差是微妙的。而不那么依賴于距離。
下圖顯示了當(dāng)我們?cè)谳S向平面下方45°的測(cè)量位置。身體對(duì)聲音的反射對(duì)的影響是巨大的。
下圖顯示了在軸向上偏差在一定程度上介于其他兩個(gè)之間,這意味著語音的頻譜隨著到麥克風(fēng)的距離而變化。
(參考: Brixen, Eddy B.: Near field registration of the human voice: Spectral changes due to positions. AES Convention 104, Amsterdam, the Netherlands. Preprint 4728)
研究表明,聲音在垂直和水平平面上都表現(xiàn)出明顯的指向性,其中高頻聲音的指向性尤為顯著。這意味著在麥克風(fēng)拾音時(shí),麥克風(fēng)的位置和方向?qū)φZ音清晰度至關(guān)重要。此外,隨著我們與聲源的距離變化,語音的頻譜也會(huì)發(fā)生變化,這進(jìn)一步強(qiáng)調(diào)了麥克風(fēng)放置的重要性。
對(duì)于頭部和胸部的反射,研究同樣揭示了它們對(duì)語音頻譜的顯著影響。領(lǐng)夾式麥克風(fēng)或頭戴式麥克風(fēng)雖然提供了行動(dòng)自由,但也可能導(dǎo)致記錄的頻譜與自然感知的頻譜存在差異。因此,在選擇和放置麥克風(fēng)時(shí),我們需要考慮這些因素對(duì)語音清晰度的影響。
頭部和胸部
在廣播和現(xiàn)場(chǎng)聲音應(yīng)用中,首選的麥克風(fēng)通常是領(lǐng)夾式麥克風(fēng)(胸部佩戴)或頭戴式麥克風(fēng)(頭戴),這允許用戶有更多的行動(dòng)自由。人們應(yīng)該意識(shí)到這樣一個(gè)事實(shí),即將麥克風(fēng)放置在如此短的距離處會(huì)導(dǎo)致記錄的頻譜不同于在正常收聽距離處感知到的自然和中性頻譜。這種差異遠(yuǎn)遠(yuǎn)不能忽略。
以下是五條曲線,解釋了將麥克風(fēng)放置在身體或頭部時(shí)語音頻譜的變化。所有曲線均基于測(cè)量值,平均為10人(見參考文獻(xiàn))。
上曲線(胸部)量化了在胸部采集的語音頻譜與在軸上1米處采集的同一個(gè)人的語音頻譜的不同方式。當(dāng)將麥克風(fēng)放在胸部時(shí),關(guān)鍵2-4 kHz范圍內(nèi)的頻率會(huì)顯著降低。
第二條曲線(頸部)顯示了麥克風(fēng)離下巴更近時(shí)的偏差。這一立場(chǎng)非常適用于廣播,因?yàn)槿绻浾呋蚴茉L者穿著t恤、運(yùn)動(dòng)衫等或外套,這是放置領(lǐng)夾式麥克風(fēng)的唯一實(shí)用方法。在戶外使用時(shí),麥克風(fēng)可以披著毛皮或戴在圍巾后面。在任何情況下:輔音頻率都會(huì)大幅降低。
前額曲線表明,將麥克風(fēng)放在前額上是對(duì)頻譜干擾最小的位置。這個(gè)位置非常適合舞臺(tái)和電影,但不適合新聞。
耳朵曲線顯示了在這個(gè)位置較高頻率的逐漸衰減。將麥克風(fēng)放置在耳朵處可以很方便;然而,它需要補(bǔ)償以保持語音可懂度。
將麥克風(fēng)放在臉頰(耳機(jī))時(shí),與大多數(shù)其他位置相比,2-4 kHz的范圍更好。然而,仍然需要在最高頻率下提升。DPA耳機(jī)具有內(nèi)置升降裝置。
需要注意的是,與胸部姿勢(shì)相比,“微笑的角落”(臉頰處)的語音水平高出約10 dB。
從曲線中可以看出,在800Hz附近存在上升的一般趨勢(shì),這可以被認(rèn)為是補(bǔ)償?shù)?。然而,最顯著的偏差是導(dǎo)致語音可懂度降低的衰減。這一定要時(shí)刻注意!
(參考: Brixen, Eddy B.: Spectral degradation of speech captured by miniature microphones mounted on Persons’ heads and chests. AES Convention no. 100, Copenhagen, Denmark. Preprint 4284.)
麥克風(fēng)的放置規(guī)則
基于上述分析,我們?yōu)辂溈孙L(fēng)的選擇和放置制定了以下規(guī)則:
人聲手持麥克風(fēng)應(yīng)位于口腔前方,角度為±30°,并盡量保持軸向?qū)R。
領(lǐng)夾式/胸部佩戴式麥克風(fēng)應(yīng)使用預(yù)均衡或后期均衡來補(bǔ)償在胸部位置處缺失的3-4kHz頻率范圍。
頭戴麥克風(fēng)相對(duì)中性,但可能仍需對(duì)高頻進(jìn)行適當(dāng)補(bǔ)償。
講臺(tái)麥克風(fēng)應(yīng)具有指向性,并指向講話者的嘴部,以減少環(huán)境噪音的影響。
在多揚(yáng)聲器環(huán)境中,應(yīng)選擇定向麥克風(fēng),并確保每個(gè)揚(yáng)聲器的麥克風(fēng)能夠?qū)⑵渌麚P(yáng)聲器的聲音衰減至少10 dB。
結(jié)語與展望
至此,關(guān)于語言清晰度(可理解性)的深入洞察系列已告一段落。我們希望通過這一系列文章,為大家提供了對(duì)語音產(chǎn)生、傳播和接收過程中影響語言清晰度的因素的全面理解。
然而,音頻技術(shù)的探索永無止境。在未來,我們將繼續(xù)關(guān)注音頻技術(shù)的最新發(fā)展,并為大家?guī)砀嚓P(guān)于音頻原理、前沿技術(shù)及其應(yīng)用場(chǎng)景的探討。讓我們共同期待音頻技術(shù)為我們帶來的更多可能!
評(píng)論comment