AI前沿解密》AI製造AI 誰在害怕(朱玉昌)
美國人工智慧新創公司Anthropic呼籲頂級AI實驗室考慮放慢開發步伐。(路透)
6月4日,矽谷AI新巨頭Anthropic發表標題名爲〈當AI開始構建自己時〉(When AI Builds Itself)的萬字長文,這家即將掛牌上市,估值近兆美元的AI公司,忽然倡議全球競爭對手,考慮暫停前沿模型研發。這次呼籲,並非AI產業首例,2023年3月,麻省理工學院未來生命研究所創始人泰格馬克(Max Tegmark)教授,就曾領銜發佈公開信,疾呼所有AI實驗室,停止訓練比GPT-4更爲強大的系統至少6個月,公開信還獲得馬斯克(Elon Musk)及辛頓(Geoffrey Hinton)等超過3萬3千人聯署,但AI軍備競賽已經啓動,沒人願意停下來。
Anthropic這回拿出一套內部數據,說明情況起了重大變化,截至2026年5月,這家公司所有納入主程式碼庫裡的程式碼,超過80%由自家研發的Claude撰寫。這個數字在2025年2月Claude Code推出前,還只是個位數,到了2026年第2季,工程師每天撰寫與合併的程式碼數量,是2024年的8倍。一位內部員工自述,大約1年前他開始全力Claude化,現有5個月沒寫過一行代碼。
值得留意的,是一條增長曲線,AI有效獨立完成任務的時長,約每4個月會翻一番,這在2024年之前,其週期約7個月。2024年3月,Claude Opus 3能獨立完成約人類4分鐘的任務。12個月後,Claude Sonnet 3.7做到了約1.5小時。到了2026年,Claude Opus 4.6已可應對約12小時的任務。最新的Claude神話模型(Mythos Preview)在METR(模型評估與威脅研究)測試框架中,持續工作超過16小時,已觸及該測試工具的量測上限。這個趨勢如果保持不變,2027年前後,AI可能獨立完成人類耗時數週的複雜任務。
簡白地說,Anthropic內部的AI已不只在幫工程師寫程式,還大量參與了程式碼撰寫、測試、最佳化,甚至一部分實驗設計。但要能夠「遞迴自我改進」(Recursive Self-Improvement, RSI),也就是AI能看懂自己的核心架構,自己修改底層演算法,讓下一代變得比自己更聰明,尚有一段距離。這個概念在業界討論了快20年,目前普遍認爲進度落在第三到第四階段,即半自動研究閉環和自改進代理。Anthropic自己的報告承認,RSI目前還沒發生,也不一定會發生,但可能比大多數機構想像的來得更快。
這個定義來自「研究品味」(Research Taste),Anthropic用一個比喻來說明這個概念,初級員工的任務是「這個按鈕壞了,去修」;有經驗的員工是「網路有時會變慢,查一下原因」;最資深的人想的則是「我們下個季度該做什麼」。按Anthropic的評估,Claude在第一層已經很強,第二層也追得很快,但第三層遇到哪些問題值得做?哪些結果可信?什麼時候該放棄?這部分現在仍是人類佔優勢。
基於這種判斷,Anthropic提出了3種未來情景。第一種,當前的進展速度放緩,前沿實驗室不再大規模推進模型研發,僅依靠現有技術水平提升生產力。第二種,研究持續快速複合增長,數十人的團隊即可完成今日需要上萬人力規模的工作量。第三種,AI跨越「研究品味」門檻,開始完全自主設計與迭代下一代模型。在第三種情景下,科學突破與安全失控可能同時降臨。
這份報告引發的討論迅疾分裂成兩派說法,一派認爲Anthropic盡到了行業領先者的責任,在問題惡化之前發出預警。另一派則指出,一家即將上市估值近兆美元的公司,在IPO之前呼籲競爭者暫緩研發,很難不讓人聯想到商業算計。
此外,還有一個更深層的結構性問題,Anthropic在報告裡理出了一條從AI輔助到AI主導的漸進路徑,2021到2023年AI是工具,偶爾幫工程師補個幾行程式碼;2023到2025年AI是助手,能生成短程式碼片段;2025到2026年AI是代理,能寫和編輯完整檔案;現在AI已進入自主代理階段,能自己跑程式碼並把任務派給其他代理;下一階段就是AI自己造AI,不是改提示詞,而是改訓練自己的程式碼、優化自己的架構、跑實驗評估自己。這個「自己改自己」的循環一旦閉合,人類的角色將從開發者變成審查者,再從審查者變成觀衆。
無論是真心示警還是上市敘事,Anthropic拋出的問題都不會消失。前沿模型的研究不會真的停下來,每家公司,每個國家,都需要在新技術浪潮中掌握競爭力。這份報告的價值,至少把一條愈來愈陡峭的曲線攤在桌面上,AI已在大規模參與AI的自主研發,但人類還不清楚這條路的盡頭是什麼樣子。
(作者爲富瑜文教基金會執行長)
※以上言論不代表旺中媒體集團立場※