百度推出AI黑科技 多模態技術實現“與動物對話”

本文轉自:人民網

5月6日,國家知識產權局公開了百度的一項動物語言轉換專利,涉及大模型及多模態等人工智能前沿技術,通過識別動物聲音、表情、動作等多模態數據,將動物語言轉換爲人類語言,這不僅增強了人類對動物行爲和情感狀態的綜合理解能力,同時也給人類與動物深層次交流帶來可能性。

據專利發明人介紹,發明這項專利的初衷是來自於一條2023年獵犬把孩子咬傷的新聞,當時大人爲了保護孩子也被撕咬,雖然這個女童經救治及時出院,但能夠提前預防是最好的。由此想到可以通過人工智能技術來識別動物的情緒,習得動物的情緒和情感,掌握動物的行爲習慣,通過設備採集多模態數據,進行數據的加工處理,做一個預訓練的模型,這樣可以提前瞭解到動物的情緒狀態。

目前,隨着寵物家庭滲透率不斷上升,動物語言轉換或許將在未來成爲智能終端的“標配能力”。同時這一技術也可能會進一步延申至動物保護和研究領域、動物園、野生動物保護區等。在寵物護理方面,該專利技術能幫助主人更好地理解寵物的情感需求,提供更貼心的照顧;在動物保護和研究領域,可爲研究人員提供深入分析動物行爲的有力工具,推動珍稀動物保護工作的開展;在動物園、野生動物保護區,有助於優化動物管理和保護策略。

據瞭解,近幾年百度通過“技術平臺+場景應用+產業生態”模式,推動專利技術向實體經濟滲透。早在2018年,百度就通過AI技術給農場裡的活牛建起自己的“電子簡歷”,讓機器一眼識別牛的體重、體尺,練就了“AI相牛”的本領,從而讓養殖和交易過程可知可控,極大降低養殖風險,提升養殖戶的收益。截至2024年底,百度在全球29個國家和地區累計公開人工智能專利申請突破2.7萬件,其中中國專利申請量達2.2萬件,授權量達1.2萬件。該專利發明人表示,期望未來專利技術能夠更多的落實到產品層面,或許在智能設備的幫助下,人們能輕鬆“聽懂”動物的“話語”,真正走進它們的內心世界。