Google DeepMind推出Aeneas模型,可修復古拉丁文殘缺文本
人工智能在最佳狀態下是一種工具,而非最終結果。它幫助人們更好地完成工作,而不是讓他們或同事失業。作爲"良性應用"的典型例子,Google DeepMind開發了一個能夠修復和解讀古代銘文的AI模型。該模型名爲Aeneas(以羅馬神話中的英雄命名),最重要的是,這個工具是開源且免費使用的。
古羅馬人留下了大量銘文,但這些文本往往殘缺不全、風化嚴重或遭到破壞。重建缺失部分是一項艱鉅的任務,需要依靠上下文線索。能夠處理這些線索數據集的算法在此時就顯得非常有用。
Aeneas加速了歷史學家最困難的任務之一:識別"相似文本"。在這種情況下,這意味着要根據措辭、語法或地區找到相似的文本排列。DeepMind表示,該模型能夠對數千份拉丁銘文進行推理分析,可以在幾秒鐘內找到相似文本,然後將任務交回給歷史學家。
DeepMind表示,它將每個文本轉化爲某種歷史指紋。"Aeneas能夠識別深層聯繫,幫助歷史學家將銘文置於更廣闊的歷史背景中,"這家Google子公司寫道。
Aeneas最令人印象深刻的功能之一是修復長度未知的文本空缺。(可以想象成填寫縱橫字謎,但你不知道每個線索有多少個字母。)該工具還具有多模態功能,意味着它可以同時分析文本和視覺輸入。DeepMind表示,這是首個能夠使用這種多重方法來確定文本來源的模型。
DeepMind表示,Aeneas被設計爲歷史學家現有工作流程中的協作夥伴。它最適合用於提供"可解釋的建議",爲研究人員提供起點。"Aeneas的相似文本分析完全改變了我對這份銘文的認知,"一位測試該模型的匿名歷史學家寫道。"它注意到了一些細節,這些細節對文本修復和年代歸屬產生了決定性影響。"
在發佈用於拉丁文本的Aeneas的同時,DeepMind還升級了Ithaca(其古希臘文本模型)。Ithaca現在由Aeneas驅動,獲得了其上下文分析和修復的超強能力。
研究人員可以在DeepMind的"預測過去"網站上試用Aeneas。該公司還開源了模型的代碼和數據集。