研究人員開發出利用光而不是空氣來檢測聲音的視覺麥克風

北京理工大學的研究人員研發出一種麥克風,它不像傳統麥克風那樣探測空氣振動,而是捕捉細微表面運動反射的光。這種新設備被稱爲“視覺麥克風”,它依賴於表面對聲波的響應,利用這些微小的振動來重建可聽信息。

這一進步爲在傳統麥克風難以實現的環境中聆聽提供了可能性,例如通過玻璃窗進行通信或在隔離空間中監聽聲音,而無需直接傳輸聲音。

“我們的方法簡化了利用光捕捉聲音的過程,降低了成本,同時還能應用於傳統麥克風無法發揮作用的場景,例如隔着玻璃窗交談,”該項目首席研究員姚旭日解釋道,“只要有光可以穿過,聲音傳輸就沒有必要。”

此前利用光捕捉聲音的嘗試依賴於複雜且昂貴的設備,例如激光器或高速攝像機。而團隊則採取了不同的方法。他們的系統採用了一種名爲單像素成像的技術,無需使用擁有數百萬像素的相機傳感器。相反,它利用的是單個光探測器和空間光調製器投射的結構光圖案。

本質上,該技術的工作原理是將經過操控的光線投射到目標上,並捕捉目標因附近聲音而振動時反射亮度的微小變化。這些微小的強度變化被檢測到,並通過計算算法將其轉換回聲音信號。這種方法不僅降低了成本和複雜性,也使該技術更容易普及。

姚教授表示:“將單像素成像與基於傅里葉變換的定位方法相結合,我們能夠使用更簡單的設備以更低的成本實現高質量的聲音檢測。我們的系統能夠在自然光照條件下,利用紙卡和樹葉等日常物品進行聲音檢測,而且不需要振動表面以特定方式反射光線。”

研究人員通過對紙卡振動進行成像(ac)來重建音頻信號。他們應用了信號處理濾波器來增強信號的高頻成分(df)。

爲了展示該系統的功能,研究人員測試了紙卡和樹葉等常見材料,並將它們放置在距離音頻源(例如播放語音數字和音樂片段的揚聲器)約半米的位置。視覺麥克風成功重建了清晰易懂的音頻,尤其是在使用紙卡時。低頻聲音的捕捉精度非常高,而高頻聲音則出現了一些失真——團隊利用信號處理技術部分緩解了這一限制。

該設置還具有數據效率,可產生約每秒 4 MB 的適度數據流,這使其適合長期或連續錄製,並且適用於存儲或互聯網傳輸。

研究人員設想了該技術在各行各業的應用,包括穿透固體屏障的通信、遠程環境監測、非侵入式醫療觀察以及先進的工業診斷等。

姚教授指出:“目前,這項技術仍處於實驗室階段,可用於傳統麥克風無法工作的特殊場景。” 該團隊目前正在努力提高靈敏度和準確性,並開發更便攜的系統版本,並擴大其探測範圍,以實現更遠距離的聲音探測。

展望未來,研究人員看到了實驗室之外的潛力——從遠距離探測心跳和脈搏,到在無法直接部署麥克風的搜救行動中提供幫助。目前,該系統代表了一種利用光“聆聽”的新方式,爲在傳統麥克風無法觸及的環境中進行通信和監控開闢了可能性。