科學(xué)家開發(fā)用于智能手機(jī)的“蝙蝠感知”技術(shù) 可利用聲音生成圖像
來(lái)源:cnBeta 編輯:QQ123 2021-05-20 08:58:51 加入收藏
值得注意的是,這項(xiàng)技術(shù)的核心是一種復(fù)雜的機(jī)器學(xué)習(xí)算法,它利用反射回聲來(lái)生成圖像,類似于蝙蝠使用回聲定位進(jìn)行導(dǎo)航和狩獵的方式。
該算法測(cè)量揚(yáng)聲器發(fā)出的聲音片段或小天線發(fā)出的無(wú)線電波脈沖在室內(nèi)空間內(nèi)發(fā)射并返回到傳感器所需的時(shí)間。通過(guò)巧妙地分析結(jié)果,該算法可以推斷出一個(gè)房間的形狀、大小和布局,以及挑選出存在的物體或人。結(jié)果以視頻形式顯示,將回聲數(shù)據(jù)轉(zhuǎn)化為三維視覺。
該團(tuán)隊(duì)的成就與蝙蝠的回聲定位之間的一個(gè)關(guān)鍵區(qū)別是,蝙蝠有兩只耳朵來(lái)幫助它們導(dǎo)航,而該算法被調(diào)整為與從單點(diǎn)收集的數(shù)據(jù)一起工作,如麥克風(fēng)或無(wú)線電天線。研究人員說(shuō),該技術(shù)可用于通過(guò)潛在的任何配備有麥克風(fēng)和揚(yáng)聲器或無(wú)線電天線的設(shè)備來(lái)生成圖像。
格拉斯哥大學(xué)的計(jì)算機(jī)科學(xué)家和物理學(xué)家周日在《物理評(píng)論快報(bào)》雜志上發(fā)表的一篇論文中概述了這項(xiàng)研究,它可以應(yīng)用于安全和醫(yī)療保健領(lǐng)域。格拉斯哥大學(xué)計(jì)算科學(xué)學(xué)院和物理與天文學(xué)學(xué)院的Alex Turpin博士和Valentin Kapitany博士是該論文的主要作者。
Turpin博士說(shuō):“動(dòng)物的回聲定位是一種了不起的能力,科學(xué)已經(jīng)成功地以多種不同的方式重新創(chuàng)造了從反射回聲中生成三維圖像的能力,如RADAR和LiDAR。”
“這項(xiàng)研究與其他系統(tǒng)的不同之處在于,首先,它只需要來(lái)自單一輸入的數(shù)據(jù)--麥克風(fēng)或天線--就能創(chuàng)建三維圖像。其次,我們相信,我們開發(fā)的算法可以將任何具有這兩件裝備中的任何一件的設(shè)備變成回聲定位設(shè)備。”
“這意味著這種三維成像的成本可以大大降低,開辟許多新的應(yīng)用。例如,通過(guò)接收入侵者反射的信號(hào),可以在沒有傳統(tǒng)攝像機(jī)的情況下保證建筑物的安全。同樣的方法也可以用來(lái)追蹤養(yǎng)老院中虛弱病人的行動(dòng)。我們甚至可以看到該系統(tǒng)被用于跟蹤醫(yī)療機(jī)構(gòu)中病人胸部的起伏,提醒工作人員注意他們的呼吸變化。”
該論文概述了研究人員如何使用筆記本電腦的揚(yáng)聲器和麥克風(fēng)來(lái)產(chǎn)生和接收千赫茲范圍內(nèi)的聲波。他們還使用天線對(duì)千兆赫茲范圍內(nèi)的無(wú)線電頻率聲音進(jìn)行了同樣的處理。
在每一種情況下,他們都收集了一個(gè)人在房間里走動(dòng)時(shí)對(duì)聲波的反射的數(shù)據(jù)。同時(shí),他們還使用一個(gè)特殊的相機(jī)記錄了房間的數(shù)據(jù),該相機(jī)使用一個(gè)被稱為飛行時(shí)間的過(guò)程來(lái)測(cè)量房間的尺寸并提供一個(gè)低分辨率的圖像。
通過(guò)結(jié)合來(lái)自麥克風(fēng)的回聲數(shù)據(jù)和來(lái)自飛行時(shí)間相機(jī)的圖像數(shù)據(jù),研究小組在數(shù)百次的重復(fù)中“訓(xùn)練”了他們的機(jī)器學(xué)習(xí)算法,將回聲中的特定延遲與圖像聯(lián)系起來(lái)。最終,該算法已經(jīng)學(xué)會(huì)了僅從回聲數(shù)據(jù)中生成它自己的高度準(zhǔn)確的房間及其內(nèi)容的圖像,使它具有感知周圍環(huán)境的“蝙蝠式”能力。
這項(xiàng)研究建立在該團(tuán)隊(duì)以前的工作基礎(chǔ)上,該團(tuán)隊(duì)訓(xùn)練了一種神經(jīng)網(wǎng)絡(luò)算法,通過(guò)使用單像素檢測(cè)器測(cè)量閃光的反射來(lái)建立三維圖像。
Turpin博士補(bǔ)充說(shuō):“我們現(xiàn)在已經(jīng)能夠利用光和聲音證明這種算法機(jī)器學(xué)習(xí)技術(shù)的有效性,這非常令人激動(dòng)。很明顯,這里有很多以新方式感知世界的潛力,我們渴望繼續(xù)探索未來(lái)生成更多高分辨率圖像的可能性。”
評(píng)論comment