國際資訊 | 人工智能重構知識創造圖譜
在人工智能技術席捲全球學術界的浪潮中,生成式人工智能對學術研究到底產生了何種影響?英國華威大學社會學系奧古斯特·孔德講席教授史蒂夫·富勒(Steve Fuller)在接受本報記者採訪時表示,生成式人工智能不僅能處理海量文獻,還能通過算法組合生成新觀點。它既是探索“未被發現的公共知識”的利器,也是重構科學研究範式的革命性力量,而人類也需要在此背景下重新定義自身。
挖掘“未被發現的公共知識”
《中國社會科學報》:如今,生成式人工智能已經加入學術論文的撰寫過程,學者應如何重新定位自己在知識創造中的角色?
富勒:該問題頗爲重大。在當前學術出版體系中,多數已發表的學術論文可能很少得到引用,甚至可能都沒人閱讀過。這些未被引用和閱讀的論文大多旨在助力作者獲得晉升和終身教職,也可能是爲了爭取下一筆研究資金。
20世紀80年代,美國信息科學家唐·斯旺森(Don Swanson)認爲,知識是公開的,但是由於知識分散在不同專業領域,因此從未產生過聯繫。交叉引用不同學科的研究成果,可以發現被忽視的關聯。斯旺森將這種被系統性忽視的研究稱爲“未被發現的公共知識”。隨着知識專業化程度的提高,這種“未被發現的公共知識”可能會越來越多,加上文獻數量持續快速增長,這些知識被人工發現的可能性較小。
如今,學術論文更多地被學術出版商出售給生成式人工智能公司的數據庫,使得其中的內容可以爲新的論文提供參考。論文原作者可能得到認可,也可能被忽略,但這或許是更好地利用大量“未被發現的公共知識”的重要途徑。
雖然給予作者適當的榮譽是現代學術獎勵制度的核心,但在科學與人文社科發展史上,不乏一些見解在初次提出時未獲充分認可,而需要在新的背景下重新展示與接受的案例,這正是生成式人工智能所能提供的新機遇。隱藏在這一切背後的問題是:知識生產是否必須經由人類主體?我個人對此持否定態度。因此,我也認爲生成式人工智能可以與人類共同撰寫甚至獨立撰寫學術論文。
人工智能的自主性逐漸增強
《中國社會科學報》:能否展開談談,爲何您認爲知識生產的主體未必是人類?
富勒:實際上,我並不認爲這一觀點十分激進。人工智能研究的終極目標,就是塑造出一種對人類具有深遠意義的智能形態。因此,當人工智能在人類極爲重視的知識領域達成這一目標時,也就不足爲奇。
此外,我一直心存疑慮,人類是否真正充分挖掘並利用了數百年來創造、積累的所有知識?這是一個尚未有明確答案的問題。在這樣的大背景下,人工智能的崛起無疑爲人類知識體系的完善與優化帶來了新的契機。它能夠使那些原本隱匿於複雜數據與文獻中的知識更加直觀地展現在人類面前,從而讓這些知識對其創造者——無論是人類還是人工智能——都發揮出更大的價值。因此,我並不反對將特定的人工智能程序列爲“共同作者”,甚至在特定情境下,將其視爲學術研究的獨立作者。
然而,我也並非毫不擔憂。我最爲憂慮的問題在於,“超級智能”機器可能會逐漸演化出一種僅限於它們自身理解的交流方式。從理論層面分析,這種情況的發生並非天方夜譚。隨着計算機技術的不斷進步,人工智能將愈發擅長自我編程,進而逐漸擺脫對人類程序員的依賴,實現更大程度的自主性。這種自主性的增強,無疑爲人工智能創造出獨立於人類理解之外的交流方式提供了可能。一旦這種情況成爲現實,人類與人工智能之間的溝通障礙將進一步加劇,知識傳遞與共享的難度也將隨之提升。這無疑是我們需要密切關注並深入思考的問題。
《中國社會科學報》:人工智能可以成爲學術研究的輔助工具,這一點很好理解。但人工智能如何獨立完成一篇論文呢?
富勒:誠然,人工智能在現階段通過搜索各類專業文獻所呈現的“未被發現的公共知識”,依然需要人類進行確認。然而,我們不難設想,倘若人工智能的程序中融入了用於開展相關研究的常規性方法信息,那麼它就能爲人類如何開展相關實證研究提供指導。此外,若人工智能以機器人的形態呈現,它甚至可以自行開展研究。
在我看來,我們有必要對人類開展學術研究的方式有一種更爲切合實際的認知。實際上,在大多數學術研究活動中,研究者往往都是對既有數據進行二次挖掘與利用,以及對已有觀點進行重新整合與編排。至於學術論文中的新數據,其作用恰恰在於爲這種數據的“循環再生”以及觀點的“重構組合”提供契機。
學術論文要求引用大量的參考文獻,這也確保了研究可以遵循上述模式,這與人工智能的研究模式存在着驚人的相似性。人工智能的信息處理能力突出,能夠快速閱讀大量學術文獻。然而,研究人員可能存在時間和精力有限、在閱讀文獻時帶有主觀傾向等諸多侷限性,導致無法對所有文獻進行全面和深入的研讀,從而忽視了重要信息。
就我個人而言,這一研究結果並不令人感到意外。回溯50多年前,當時相對初級、基礎的計算機編程技術,對各類醫學症狀進行加權計算與綜合分析,在疾病診斷領域就已經展現出了超越臨牀醫生的實力。20世紀80年代和90年代,初級形式的人工智能就已被用於爲“專家系統”編程,這些系統再現了醫生診斷病人時所採取的決策路徑。這些程序因不會受到誤解或記憶錯誤的影響,往往比人類醫生更爲準確。
人工智能具有創新潛力
《中國社會科學報》:寫作論文確實需要很多參考文獻,但也需要發現“研究空白”,即創新點和突破口。這是人工智能可以做到的嗎?
富勒:我認爲原則上可以,甚至現在就已經具備一定的可能性。當我們談論知識中的“空白”尤其是科學知識領域的空白時,指的是一種形式受限的無知。換言之,尚未知曉的事物是依據人們已經掌握的知識來界定的,這也是爲何科學探索常常被描述爲“解決問題”。即便是最具創新精神的科學家,例如愛因斯坦,也是遵循這樣的方式開展研究工作的。然而,在這些極具創新性的案例中,問題往往超越了人們的知識基礎。當以這樣的視角看待科學創新時,就會發現它似乎正是人工智能勝任的事情。
事實上,早在20世紀80年代,人工智能領域的先驅之一赫伯特·西蒙(Herbert Simon)就開發了一系列名爲“BACON”(以近代實驗科學方法創始人弗朗西斯·培根的名字命名)的計算機程序,旨在從不同甚至雜亂的數據中發現經驗法則。西蒙在設計“BACON”時,研究了伽利略、開普勒和波義耳是如何從現有的經驗數據中推導出數學定律的。他運用這些科學家用來生成假設的技術(西蒙稱之爲“啓發式技術”)進行編程,然後計算機對這些假設進行測試,直到發現正確的定律。
誠然,這屬於水平相對較低的科學創新。但即便如此,由於“BACON”掌握了歷史上發現此類規律的途徑,其速度遠超人類。儘管西蒙並未對“BACON”展開進一步深入研究,但他認爲,人類和計算機一樣,解決問題的能力在很大程度上是通過相關的背景知識和技能預先賦予的。從這一角度看,計算機編程與人類教育類似。