☰

AI前沿解密》AI製造AI 誰在害怕（朱玉昌）

美國人工智慧新創公司Anthropic呼籲頂級AI實驗室考慮放慢開發步伐。（路透）

6月4日，矽谷AI新巨頭Anthropic發表標題名爲〈當AI開始構建自己時〉（When AI Builds Itself）的萬字長文，這家即將掛牌上市，估值近兆美元的AI公司，忽然倡議全球競爭對手，考慮暫停前沿模型研發。這次呼籲，並非AI產業首例，2023年3月，麻省理工學院未來生命研究所創始人泰格馬克（Max Tegmark）教授，就曾領銜發佈公開信，疾呼所有AI實驗室，停止訓練比GPT-4更爲強大的系統至少6個月，公開信還獲得馬斯克（Elon Musk）及辛頓（Geoffrey Hinton）等超過3萬3千人聯署，但AI軍備競賽已經啓動，沒人願意停下來。

Anthropic這回拿出一套內部數據，說明情況起了重大變化，截至2026年5月，這家公司所有納入主程式碼庫裡的程式碼，超過80%由自家研發的Claude撰寫。這個數字在2025年2月Claude Code推出前，還只是個位數，到了2026年第2季，工程師每天撰寫與合併的程式碼數量，是2024年的8倍。一位內部員工自述，大約1年前他開始全力Claude化，現有5個月沒寫過一行代碼。

值得留意的，是一條增長曲線，AI有效獨立完成任務的時長，約每4個月會翻一番，這在2024年之前，其週期約7個月。2024年3月，Claude Opus 3能獨立完成約人類4分鐘的任務。12個月後，Claude Sonnet 3.7做到了約1.5小時。到了2026年，Claude Opus 4.6已可應對約12小時的任務。最新的Claude神話模型（Mythos Preview）在METR（模型評估與威脅研究）測試框架中，持續工作超過16小時，已觸及該測試工具的量測上限。這個趨勢如果保持不變，2027年前後，AI可能獨立完成人類耗時數週的複雜任務。

簡白地說，Anthropic內部的AI已不只在幫工程師寫程式，還大量參與了程式碼撰寫、測試、最佳化，甚至一部分實驗設計。但要能夠「遞迴自我改進」（Recursive Self-Improvement, RSI），也就是AI能看懂自己的核心架構，自己修改底層演算法，讓下一代變得比自己更聰明，尚有一段距離。這個概念在業界討論了快20年，目前普遍認爲進度落在第三到第四階段，即半自動研究閉環和自改進代理。Anthropic自己的報告承認，RSI目前還沒發生，也不一定會發生，但可能比大多數機構想像的來得更快。

這個定義來自「研究品味」（Research Taste），Anthropic用一個比喻來說明這個概念，初級員工的任務是「這個按鈕壞了，去修」；有經驗的員工是「網路有時會變慢，查一下原因」；最資深的人想的則是「我們下個季度該做什麼」。按Anthropic的評估，Claude在第一層已經很強，第二層也追得很快，但第三層遇到哪些問題值得做？哪些結果可信？什麼時候該放棄？這部分現在仍是人類佔優勢。

基於這種判斷，Anthropic提出了3種未來情景。第一種，當前的進展速度放緩，前沿實驗室不再大規模推進模型研發，僅依靠現有技術水平提升生產力。第二種，研究持續快速複合增長，數十人的團隊即可完成今日需要上萬人力規模的工作量。第三種，AI跨越「研究品味」門檻，開始完全自主設計與迭代下一代模型。在第三種情景下，科學突破與安全失控可能同時降臨。

這份報告引發的討論迅疾分裂成兩派說法，一派認爲Anthropic盡到了行業領先者的責任，在問題惡化之前發出預警。另一派則指出，一家即將上市估值近兆美元的公司，在IPO之前呼籲競爭者暫緩研發，很難不讓人聯想到商業算計。

此外，還有一個更深層的結構性問題，Anthropic在報告裡理出了一條從AI輔助到AI主導的漸進路徑，2021到2023年AI是工具，偶爾幫工程師補個幾行程式碼；2023到2025年AI是助手，能生成短程式碼片段；2025到2026年AI是代理，能寫和編輯完整檔案；現在AI已進入自主代理階段，能自己跑程式碼並把任務派給其他代理；下一階段就是AI自己造AI，不是改提示詞，而是改訓練自己的程式碼、優化自己的架構、跑實驗評估自己。這個「自己改自己」的循環一旦閉合，人類的角色將從開發者變成審查者，再從審查者變成觀衆。

無論是真心示警還是上市敘事，Anthropic拋出的問題都不會消失。前沿模型的研究不會真的停下來，每家公司，每個國家，都需要在新技術浪潮中掌握競爭力。這份報告的價值，至少把一條愈來愈陡峭的曲線攤在桌面上，AI已在大規模參與AI的自主研發，但人類還不清楚這條路的盡頭是什麼樣子。

（作者爲富瑜文教基金會執行長）

※以上言論不代表旺中媒體集團立場※

AI前沿解密》AI製造AI 誰在害怕（朱玉昌）

相關資訊