【全文版】對話Sam Altman:GPT-5、星門計劃與人工智能的未來· OpenAI播客EP1 | 1.5萬字+視頻
文:Web3天空之城| 未經許可不得轉載
【城主說】OpenAI開播了!今天OpenAI官方新鮮熱辣放出了博客第一期,首席執行官Sam Altman親自上陣作爲嘉賓。
在自家的播客第一期裡,探討了奧爾特曼對人工智能現狀與未來的多維度思考。內容涵蓋了AI在日常生活(如育兒)中的應用、對通用人工智能(AGI)和超級智能的定義、下一代模型GPT-5的展望、用戶隱私與商業模式的權衡、以及旨在解決未來算力需求的“星門”計劃。
核心觀點
• 超級智能的衡量標準 :真正的超級智能並非僅指認知能力,而是指能夠自主發現新科學或極大加速人類科學發現進程的系統。
• “星門”計劃的願景 :這是一項旨在建設前所未有規模的算力基礎設施的宏大計劃,目標是讓智能變得極其廉價和普及,從而驅動下一代AI服務。
• 隱私是核心原則 :隨着AI與用戶生活的深度融合,保護用戶隱私必須成爲不可動搖的核心原則,任何商業模式或外部壓力都不能損害用戶的信任。
• AI發展的迭代性 :模型的發展正從離散的版本發佈轉向持續迭代和改進。未來如GPT-5的更新,將是一個不斷變強的複雜系統,而非單個靜態模型。
• 人機交互的未來 :當前爲無AI世界設計的硬件和軟件範式即將過時,未來的設備將更深入地感知環境、理解用戶語境,並支持全新的交互方式。
安德魯·梅恩: 歡迎收聽OpenAI播客。 我的名字是安德魯·梅恩。 幾年來,我曾在OpenAI工作,先是擔任應用團隊的工程師,後來是科學傳播者。 之後,我與多家公司和個人合作,試圖弄清楚如何整合人工智能。 通過這個播客,我們有機會與在OpenAI工作或與OpenAI合作的人們交談,瞭解幕後發生的事情,或許也能一窺未來。 我的第一位嘉賓是OpenAI的首席執行官兼聯合創始人薩姆·奧爾特曼。 我們將更多地瞭解“星門”項目,他作爲父母如何使用ChatGPT,或許還能得知GPT-5何時問世。
人工智能與日常生活:從育兒到學習
安德魯·梅恩: 每年都會有越來越多的人認爲我們已經達到了通用人工智能系統。 人們對硬件和軟件的需求正在迅速變化。 如果人們知道我們能用開放計算做什麼,他們會想要更多,更多。 我有個朋友是新晉父母,他們大量使用ChatGPT來提問。 它已經成爲一個非常好的資源。 你也是新晉父母,ChatGPT在這方面幫了你多少?
薩姆·奧爾特曼: 很多。 我是說,顯然人們在沒有ChatGPT的情況下也能照顧嬰兒很長時間。 我不知道我當時會怎麼做。 最初的幾周,幾乎每隔…… 我是說,是持續不斷地。 現在我更多地會問一些關於發展階段的問題,因爲基本的我都能處理了,但是…… 這正常嗎? 嗯,但那對那件事超級有幫助。
我花了很多時間思考我的孩子未來將如何使用人工智能。 順便說一句,這有點像極度倡導生育。 我認爲每個人都應該多生孩子。 是的,我在OpenAI的很多朋友,包括前同事和現任同事,都在生孩子,人們會問,那個人工智能的事情怎麼辦? 我認識的內部人員都對組建家庭非常樂觀。 我認爲那是個好跡象。
比如,我的孩子永遠不會比人工智能更聰明,但他們也會長大。 這真是打擊他們了。 我是說,他們長大後會比我們這一代人能力強得多,能做我們無法想象的事情,而且他們會非常擅長使用人工智能。 顯然我經常思考這個問題,但我更多思考的是他們將擁有我們不曾擁有的東西,而不是他們會失去什麼。 他們就像是,我不認爲我的孩子會因爲他們不比人工智能聰明而感到困擾。 我就是覺得,你知道,有一個視頻一直讓我印象深刻:一個嬰兒或蹣跚學步的小孩拿着一本舊的光面雜誌,在屏幕上做這樣的動作。 是因爲它是個iPad嗎? 我以爲那是個壞掉的iPad。 而且,你知道,現在出生的孩子會認爲世界一直都有人工智能,他們會極其自然地使用它,他們會回顧現在,覺得這是一個非常,你知道的,史前時期。
安德魯·梅恩: 我在社交媒體上看到一件事,有個男人說他厭倦了和孩子聊托馬斯小火車。 於是他把內容輸入到ChatGPT的語音模式裡。 孩子們喜歡ChatGPT的語音模式。 一個小時後,他發現那孩子還在談論托馬斯小火車。
薩姆·奧爾特曼: 再者,我懷疑這不會全是好事。 會有問題。 人們會發展出這些或多或少有問題,甚至可能有很大問題的擬社會關係,社會將不得不找出新的防護措施,但其益處將是巨大的。 而且我們,整個社會普遍擅長找出如何減輕這些弊端。 是的。 所以,是的,我認爲我很樂觀。
安德魯·梅恩: 我們看到一些有趣的數據表明,在教室裡有優秀教師和良好課程的配合下,ChatGPT變得非常好用。 如果單獨使用,僅僅作爲家庭作業的輔助工具,可能會導致孩子們像只是在谷歌上搜索資料一樣。
薩姆·奧爾特曼: 我就是那種每個人都曾擔心過的孩子。 我原打算等它問世後就凡事都去谷歌搜索,然後停止學習。 而且,你知道,事實證明學校裡的孩子們適應得相對較快。 所以我想我們會解決這個問題的。
安德魯·梅恩: 山姆,想想如果你沒有凡事都去谷歌搜索,你會變成什麼樣。 你明白嗎? 所以我們看到了這些普及數據,它們真是驚人。 它是OpenAI最受歡迎的產品。 五年後,它還會是ChatGPT嗎?
薩姆·奧爾特曼: 我的意思是,我覺得五年後ChatGPT會變成一個完全不同的東西。 所以從某種意義上說,不會,但它還會被叫做ChatGPT嗎? 很可能。 是的。
安德魯·梅恩: 好的。 所以這是一個紮實的名字。
重新定義智能:從AGI到超級智能
薩姆·奧爾特曼: 從許多意義上講,如果你在五年前,讓我或其他人基於軟件的認知能力提出AGI的定義,我認爲那時許多人會給出的定義,現在已經遠遠被超越了。 這些模型現在很智能。 是的。 而且它們會持續變得更智能。 它們會持續改進。 我認爲每年都會有越來越多的人認爲我們已經達到了通用人工智能系統。 儘管定義會不斷外延並變得更具雄心,但仍會有更多人認可它。 但你知道,我們現在擁有的系統確實能夠大幅提升人們的生產力,並能從事有價值的經濟工作。
也許一個更好的問題是,要達到我所說的超級智能需要什麼條件? 好的。 如果我們有一個系統,能夠自主發現新科學,或者大幅提升人們利用工具發現新科學的能力,那麼對我而言,這幾乎就等同於定義上的超級智能,並且我認爲這對世界來說將是一件美妙的事情。
安德魯·梅恩: 所以,基本上,很多時候這都像一個梯度過程,它不斷變得越來越好,而我們每一個定義都會說,哦,這感覺…… 當我們達到GPT-4,或在內部試用它時,我就是這種感覺。 我就想,我們有10年的發展空間,可以用它做很多事情。 甚至當它開始自我運行,比如你可以輸入推理指令時,它表現得非常強大。 但當你說它提出了什麼新的定理或證明,然後,哦,嘿,我們找到了更好的癌症療法,或者我發現了一些新的GLP藥物之類的。
薩姆·奧爾特曼: 是的,我的意思是,我堅信人們生活變好的主導因素是更多的科學進步。 那纔是限制我們的地方。 所以如果我們能發現更多,我認爲那將真正產生非常顯著的影響。 對我來說,那將是一個極其令人興奮的里程碑。 我認爲人工智能的許多其他出色應用也會出現,但那個感覺真的非常重要。
安德魯·梅恩: 你在內部看到過這種跡象嗎? 你看到過讓你覺得“哦,我想我們差不多弄明白了”的事情嗎?
薩姆·奧爾特曼: 我不會說我們已經完全弄明白了,但我會說我們對所追求的方向越來越有信心。 也許是,我的意思是,這是人人都在談論的例子,但我認爲它仍然很有趣。 人們使用人工智能系統編寫代碼,編碼人員的生產力大幅提高,從而研究人員的生產力也隨之提高,這是怎麼回事? 這就好比一個例子,它顯然沒有創造新的科學,但它確實讓科學家們能夠更快地完成他們的工作。 我們也經常從科學家那裡聽到關於O3的類似說法。 所以我不會說我們已經完全弄明白了。 我不會說我們已經掌握了算法,或者說我們只要指着它,它就能自己去進行科學研究,但我們正在獲得不錯的猜測。 而且進展速度仍然令人印象深刻。
[安-德魯·梅恩]: 看着從O1到O3的進展,那時幾乎每隔幾周,團隊就會說:“我們有了一個重大的新想法”,然後大家就都繼續投入工作。 這也提醒我們,有時當你發現一個重大的新見解時,事情的進展會出乎意料地快。 我相信我們還會看到很多次這樣的情況。 我最近注意到OpenAI剛剛將模型和操作轉移到了O3。 是的。 我注意到有了很大的改進。
薩姆·奧爾特曼: 好得多。 我想說,我們之前遇到的問題是其脆弱性,就是說,人們承諾的代理系統可以做所有這些事情,但一旦遇到無法解決的問題,它就崩潰了。
工具的進化:從O3到深度研究
安德魯·梅恩: 有趣的是,說到通用人工智能的問題,很多人告訴我,他們感到觸動的時刻是O3的操作能力。 觀看一個人工智能相當好地使用電腦,雖然不完美,但它並非…… O3是一個巨大的進步,感覺非常像通用人工智能。
薩姆·奧爾特曼: 它對我沒有產生同樣程度的影響,儘管它相當令人印象深刻,但我已經聽過很多次了。 我感到觸動的時刻是深度研究,因爲那感覺像是它的真正代理式應用。 那就是我回來,就我感興趣的一個話題產出了比我以前讀過的任何東西都好的內容,因爲之前所有那些模型都只是獲取一堆資料,然後進行總結。 但是當我看到這個系統連接互聯網、獲取數據、順藤摸瓜、追溯源頭、然後返回,它做得比我更好,這很有趣。
安德魯·梅恩: 我最近遇到一個人,他是一個狂熱的自學者,癡迷於學習,並且無所不知。 他利用深度研究,就他好奇的任何事物撰寫報告,然後一整天就坐在那裡,已經擅長快速消化這些報告並知道下一步該提出什麼問題。 對於那些對學習有着極度渴望的人來說,這是一個令人驚歎的新工具。 我開發了自己的應用程序,它確實能讓我提問,併爲我生成相關內容的音頻文件,因爲它就是這樣運作的。 我的好奇心可能超出了我的記憶力。
在Operator中,對我來說最神奇的時刻,而且我很好奇接下來事情會如何發展,是當時我正在研究馬歇爾·麥克盧漢,想獲取大量他的圖片,我讓你去做了,然後突然之間,我就有了一個裝滿了這些圖片的文件夾,這對於一項研究工作來說,我自己做的話會耗費我極長的時間。
安德魯·梅恩: 是的,你是如何使用它的? 深度研究嗎?
薩姆·奧爾特曼: 是的。 我感興趣的科學領域是? 我現在處於一個奇怪的境地,時間極其緊張。 如果我有更多時間,我會優先閱讀深度研究報告,而不是閱讀大多數其他內容,但我總體上閱讀時間不足。 另外,很棒的是分享功能,我喜歡它,因爲現在更容易與他人分享。 PDF 文件很棒,這很酷。
下一代產品:GPT-5、版本與記憶
安德魯·梅恩: 而且我會說,儘管我們有深度研究,我們有這些工具,但一場模型競賽正在進行中。 所以問題就來了,GPT-5會是什麼情況?以及,是否有觀點認爲,有了那樣的系統,我們應該看到能力上的提升? GPT-5的時間表是怎樣的? 我們什麼時候能看到它?
薩姆·奧爾特曼: 可能是今年夏天某個時候。 對。 我不知道具體是何時。 我們反覆討論的一件事是,對於新模型,我們應該在版本號上做多大的提升,還是像我們對待GPT-4.0那樣,只是讓它變得越來越好。
安德魯·梅恩: 而我當時必須處理最近的GPT-4,對吧? 當它發佈時。 同時,我必須對GPT-4和3.5進行某種程度的測試比較。 而3.5則持續變得越來越好。 於是我能進行的比較也在不斷變化。 所以,這就是我的問題。 是的,就好比我能區分GPT-5和“哇,這是一個非常優秀的GPT-4.5”嗎?
薩姆·奧爾特曼: 未必。 我的意思是,這兩種情況都可能發生,對吧? 你可以一直迭代4.5版本,或者在某個時候你就可以稱其爲5。 過去情況要明確得多。 我們會訓練一個模型並將其發佈。 然後我們會訓練一個新的大型模型並將其發佈。 而現在系統已變得複雜得多,我們可以持續地對它們進行後期訓練以使其變得更好。 我現在正在思考這件事。 比如每次,假設我們推出了GPT-5,然後我們不斷地更新它。 我們是否應該像對待GPT-4.0那樣,繼續稱之爲GPT-5,還是應該稱之爲5.1、5.2、5.3? 這樣你就知道版本何時變化了。 我認爲我們對此還沒有答案,但我認爲有比我們處理4.0的方式更好的做法。 我們週期性地看到這種情況。 比如有時人們更喜歡某個快照,而非另一個,他們可能想繼續使用其中一個。 我們得想辦法解決這個問題。
安德魯·梅恩: 是的,挑戰在於即使你懂技術,你也能大概理解,好的,如果前面有個零,我就知道了,但如果我想,你知道,比如,但即便如此也不清楚,我該用O4 mini,我該用O3,我該用這個嗎? 我認爲這就像一個例子,這是範式轉變的產物。 然後我們似乎同時推進着這兩件事。
薩姆·奧爾特曼: 我認爲我們即將解決當前的這個問題,但我能想象一個世界,我不知道它是什麼,但我能想象一個世界,在那裡我們發現某種新範式,那再次意味着我們需要分叉模型樹。 甚至更復雜的名稱。 我希望我們不必那樣做。 我很高興能直接用上GPT-5,然後再用上GPT-6。 我認爲那樣人們會更容易使用。 你也不必考慮,我是想要O4 mini high、O3還是O4,諸如此類……
安德魯·梅恩: O4 mini high是我用來編程的。 當我想進行對話時,就用O3。
安德魯·梅恩: 是的,當你明白它們各自的含義時,有選擇是很有趣的,但這仍然…… 我認爲,讓這些事物功能更強大,但同時也更難理解其能力來源的因素之一,是諸如記憶等方面的整合。 記憶最初只是一件非常簡單的事情,但現在它變得更加複雜了。
薩姆·奧爾特曼: 記憶功能可能是我最近最喜歡的ChatGPT功能。 知道嗎,我們第一次能和電腦對話時,比如和GPT-3或其他什麼的,那感覺就像一件非常了不起的事情。 而現在,這臺電腦,我感覺它好像對我有了很多語境瞭解。 如果我只用寥寥數語問它一個問題,它就能充分了解我生活的其他方面,從而相當確定我想要它做什麼。 有時候甚至以我意想不到的方式,這真是一個令人驚喜的飛躍。 所以我……而且我也從許多其他人那裡聽到過這種說法。 有些人不喜歡它,但大多數人確實很喜歡。 我認爲我們正在邁向這樣一個世界:如果你願意,人工智能將對你的生活擁有難以置信的上下文信息,併爲你提供極其有用的答案。
隱私、信任與商業模式的挑戰
安德魯·梅恩: 對我而言,這很酷。 能夠將其關閉的事實也很好。 但其中一個挑戰出現在《紐約時報》與OpenAI正在進行的訴訟中,他們剛剛要求法院告知OpenAI,他們必須保留消費者ChatGPT的用戶記錄,超過因常規原因而必須保存的30天期限。 針對此事,布拉德·萊特卡普寫了一封信作爲迴應。 您能解釋一下OpenAI的立場嗎?
薩姆·奧爾特曼: 顯然,我們將對此進行抗爭。 我認爲,我希望,但我確實認爲我們會贏。 我認爲《紐約時報》提出這種要求是離譜的越權行爲。 這(指《紐約時報》)是聲稱重視用戶隱私的一方,等等。 但我,想要在此尋找一線希望。 我希望這將是一個社會意識到隱私真正重要的時刻。 隱私需要成爲使用人工智能的核心原則。 你不能讓像《紐約時報》這樣的公司要求人工智能提供商損害用戶隱私。 我認爲社會需要…… 我認爲《紐約時報》這樣做確實很不幸。 但我希望這能加速社會需要進行的、關於我們將如何對待隱私和人工智能的對話。 我希望答案是,我們非常非常認真地對待它。 人們現在正在與ChatGPT進行相當私密的對話。 ChatGPT將是一個非常敏感的信息來源。 我認爲我們需要一個能反映這一點的框架。
安德魯·梅恩: 因此,這引出了正在使用或持懷疑態度的人提出的另一個問題:OpenAI現在可以訪問這些數據。 擔憂之一是關於訓練,對此OpenAI已經非常清楚地說明了何時進行或不進行訓練,你也有選擇關閉該功能的選項。 另一件事是廣告之類的內容。 OpenAI對此的方針是什麼? 你們將如何承擔這項責任?
薩姆·奧爾特曼: 我們尚未推出任何廣告產品。 我某種意義上,我的意思是,我並非完全反對。 我可以指出一些我喜歡廣告的方面。 我覺得Instagram上的廣告,挺不錯的。 我從他們那裡買了不少東西。 但我認爲,這會非常困難,需要投入大量精力才能妥善處理。 人們對ChatGPT有着極高的信任度,這很有趣,因爲AI會產生幻覺。 它本應是你不太信任的那種技術。
安德魯·梅恩: 我的朋友也會胡編亂造。 所以我信任他們。
薩姆·奧爾特曼: 人們確實如此。 但我認爲部分原因在於,如果你將我們與社交媒體或網頁搜索等進行比較,在這些平臺中,你能或多或少地察覺到你正在被變現,而且公司在努力爲你提供好的產品和服務,這毫無疑問,但同時也在某種程度上試圖讓你點擊廣告之類的東西。 你知道,你在多大程度上相信你得到的是該公司實際認爲對你來說最好的內容,而不是那種也試圖與廣告結合的內容呢? 我認爲這裡面存在某種心理因素。
所以舉例來說,我認爲如果我們開始修改輸出,比如根據誰支付我們更多來修改從大語言模型(LLM)返回的信息流,那會讓人感覺非常糟糕。 作爲用戶我將非常討厭那樣。 我認爲那會是一個破壞信任的時刻。 也許如果我們只是說,嘿,我們永遠不會修改那個信息流。 但如果點擊那裡面的某樣東西,而那本來就是我們會展示的內容,那麼我們就能獲得一點交易收入,而且對所有人來說都是統一的。 如果我們,你知道,有一個簡便的支付方式或者類似的東西,也許那樣可行。 也許可以在交易流之外放置廣告。 抱歉,是在LLM信息流之外,但仍然非常出色。 但我認爲那裡的舉證責任會非常高。 而且它必須讓用戶覺得真正有用,並且非常清楚它沒有干預LLM的輸出。
安德魯·梅恩: 是的,這會是一個難題。 我希望有解決方案。 我很樂意通過 ChatGPT 或一個非常好的聊天機器人進行所有采購,因爲很多時候我覺得我沒有做出最明智的決定。
薩姆·奧爾特曼: 從而減輕... 不,如果我們能以某種非常清晰和一致的方式做到這一點,那就很好。 但我不知道。 我喜歡我們能夠提供優質的服務。 人們爲此向我們付費。 這非常明確。 那是有益的。
安德魯·梅恩: 我會說,模型上的區別在於,我認爲谷歌構建了很棒的東西。 我認爲新的 Gemini 2.5 是一個非常好的模型。 我認爲他們從…… 這是一個非常好的模式。 是的,他們從那種“哦,老天,這些東西真不錯”的心態轉變爲…… 但歸根結底,谷歌是一家廣告技術公司。 而這正是總讓我有些…… 使用他們的API等並不那麼令人擔憂,儘管…… 但我確實會想,老天,如果我正在使用他們的聊天機器人,那無論是何種情況,我的想法是他們的激勵措施是否與此保持一致。
薩姆·奧爾特曼: 谷歌搜索在很長一段時間裡都是一款出色的產品。 我確實覺得它已經退化了。 但也曾有一段時間,雖然廣告很多,但我仍然認爲它是互聯網上最好的東西。 我的意思是,我喜歡谷歌搜索。 所以我不是…… 比如說,顯然有可能成爲一家優秀的廣告驅動型公司。 但是……我挺尊重谷歌所做的很多事情。 但是顯然也存在問題。
安德魯·梅恩: 是的,我…… 作爲一名蘋果用戶,我喜歡的蘋果模式是,我知道,我爲我的手機支付了很多錢,但我也知道他們並沒有試圖在裡面塞入所有這些東西。 他們做了iAds,那,你知道,效果不是特別好,這可能表明他們真的沒有用心去做。
安德魯·梅恩: 是的。 所以我想,這會很有趣。 但我們必須繼續觀察和關注這件事。 我們開始想,嘿,你知道,Janchi Patee 真的在大力推動這件事。 我需要開始思考這件事。
模型個性、對齊與“星門”計劃
安德魯·梅恩: 所以我們遇到了一個問題。 有一個模型更新。 然後發生的事情是,看來這個模型似乎有點過於討好,有點過於順從了。 隨着人們越來越多地使用這些系統並與之建立這種關係,這引出了人機交互的問題。 那麼,您如何看待這種趨勢的走向,以及在個性方面會開闢出怎樣的可能性?
薩姆·奧爾特曼: 社交媒體時代的一大錯誤是,信息流算法對整個社會,甚至可能對個人用戶,產生了一系列意想不到的負面後果。 儘管它們正在做用戶想要的事情,或者有人認爲用戶當下想要的事情,即讓他們持續在該網站上花費時間。 而這正是社交媒體的重大錯位。 我認爲還有很多其他因素,比如讓人心煩相比快樂和滿足,更能讓人沉迷其中。
我一直都知道人工智能領域會出現新的問題,會出現某種以不明顯方式錯位的情況。 但我們確實遇到的首批問題之一是,如果你詢問用戶對某一個特定回覆的需求,與之相對的是,當你試圖構建一個對用戶最有幫助的模型,然後向用戶展示,比如說,兩個回覆,並詢問:“哪個對你更有幫助?”在任何特定情況下,你可能希望模型以某種方式行事,但在你與人工智能的所有互動過程中,這可能並不相符。 你知道,你可以看到,而且我們也確實看到了這些問題,即如果你過於關注用戶信號,以及我們在事後分析中討論的許多其他問題,但我認爲這只是一個有趣的例子。 從短期來看,你某種程度上無法獲得用戶最想要的行爲,或者說從長遠來看對用戶最有幫助、最有用或最健康的行爲。 所以,你知道,也許對過濾氣泡的類比,將會是那些在短期內對用戶有益,但長期則不然的人工智能。
安德魯·梅恩: 我認爲Dolly 3就是這種跡象的一個表現,我認爲它在技術上是一個非常有能力的模型,但它們都開始傾向於一種類型的圖像流派。 而且它們都像是那種HDR風格。 這是否來自於用戶進行那種比較時,僅僅孤立地看待這兩個事物,然後說“我更喜歡這一個”的結果呢?
薩姆·奧爾特曼: 我不記得Dolly 3是否如此,但我猜是這樣。 是的,我認爲它已經變得更好了。 新的圖像模型簡直是…… 新的圖像模型太棒了。 好得令人難以置信。 我簡直無法想象它今後會發展到何種程度。
安德魯·梅恩: 因此,當你構建這些系統並增加使用量時,這總是一個問題。 新的圖像模型發佈後,你必須限制使用,就像Sora那樣,你只能擁有一定量的算力來完成任務,這說明了大家面臨的巨大問題,那就是算力。 爲了解決這個問題,我們聽說了“星際之門”項目,它有一個非常酷的名字,而且與計算機有關。 除此之外,我認爲很多人都對它的價格感到震驚,因爲它高達五千億美元。 我們會說:“等等,什麼?”我該如何向我媽媽簡單描述“星際之門”呢?
薩姆·奧爾特曼: 我認爲這相當簡單。 它是一項旨在資助和構建前所未有算力的努力。 確實如此,人們…… 我們沒有足夠的算力讓人們隨心所欲地做他們想做的事。 但如果人們知道我們能用更多的算力做什麼,他們會想要更多更多。 因此,我們今天能爲世界提供的,與在算力增加十倍,甚至有朝一日有望增加百倍的情況下能提供的,存在着巨大的鴻溝。 人工智能與我曾從事的其他技術不同之處,或者至少就人工智能而言,將其有效地交付給全球數億乃至數十億人的規模,就在於其所需的基礎設施投資是多麼巨大。 因此,“星門”計劃旨在彙集大量資本、技術和運營專長,以建設基礎設施,從而向所有需要的人提供下一代服務,並使智能儘可能地普及和廉價。
安德魯·梅恩: 因此,這是一個大規模的全球項目。 我們之前談過,其中一個合作伙伴是阿聯酋。 你們正在爲此努力。 你們正在與世界各國政府就此合作。 其中一個考慮因素是,你知道,社交媒體上有人問過,五千億美元,5000億美元。 你們有這筆錢嗎?
薩姆·奧爾特曼: 它就在房間裡。 但我們將在接下來的... 甚至用不了那麼多年,你知道的,除非真的出現什麼問題,結果我們造不出這些計算機。 我堅信人們會把這件事辦好。 我最近去了我們在阿比林正在建設的第一個場地。 那大約是,你知道的,對“星際之門”項目最初承諾總額的約10%,也就是約5000億美元的投入。 真是令人驚歎。 我腦海中知道一個吉瓦級規模的場地是什麼樣子,但親身去看看正在建設中的,以及成千上萬的人四處忙碌地施工,走進安裝圖形處理器的房間裡,看看整個系統是多麼複雜,以及它建設的速度,真是非同凡響。 我們很快就會分享更多關於下一批地點的信息,但有一個關於鉛筆的絕佳引言,就像一支標準的,你知道的,木質石墨鉛筆,它說明了沒有人能獨自造出它。 這就像是資本主義的魔力。 世界能夠協調起來做這些事情,這真是一個奇蹟。 站在第一個Stargate基地裡,我真正在思考的是,要讓這些成排的GPU運行起來,所需要的全球性複雜程度。 你知道,當你拿出手機,在ChatGPT裡輸入一些東西並得到答案時,你可能……到了這個階段,你可能甚至不覺得那有什麼特別令人驚訝的。 你只是期望它能正常工作。 曾幾何時,也許是你第一次嘗試時,你會覺得,那真是太神奇了。 但是,在過去一千年或至少幾百年裡,人們極其努力地工作,才取得了這些來之不易的科學洞見,然後在此基礎上建立了工程體系、公司和複雜的供應鏈,並重構了世界,所有這些都必須發生,才能讓這些“魔力機架”被放置在某個地方。 想想所有爲此投入的東西。 並將其一直追溯到那些只是從地裡挖出石頭並觀察結果的人們。 所以你現在只需在ChatGPT中輸入內容,它就能爲你完成任務。
競爭、能源與全球合作
安德魯·梅恩: 我讀過一個關於“星門計劃”開發及其國際合作(特別是與阿聯酋的合作)的幕後故事,以及埃隆·馬斯克曾試圖阻撓該計劃。 你看到了什麼? 你聽到了什麼?對此有何看法?
薩姆·奧爾特曼: 我曾說過,我想也是對外說過,但至少是在內部說過,在大選之後,我不認爲埃隆會濫用他在政府中的權力進行不公平競爭。 遺憾地說,我在這方面錯了。 我的意思是,我通常不喜歡犯錯,但主要是我覺得他會做這些事,這對國家來說真的非常不幸。 我沒有想到,我真心地沒有想到他會那樣做。 我很感謝本屆政府確實做了正確的事情,並堅持抵制了那種行爲,但是,是的,這很糟糕。
安德魯·梅恩: 嗯,我認爲改變了的是,而且我認爲格雷格·布洛克曼剛剛談到了這一點,那就是幾年前,人們認爲,誰先達到目標誰就是贏家,僅此而已,遊戲就結束了。 而現在我們意識到其他地方也有很棒的人工智能實驗室,比如Anthropic正在構建出色的工具。 我認爲谷歌真的提升了它的競爭力。 到處都有好的事情發生,而且不會是一個人獨佔鰲頭。
薩姆·奧爾特曼: 我同意。 我最喜歡的一個例子是,人工智能的發現與此類似,雖不完美,但很接近,在許多令人驚訝的方面與晶體管的發現類似。 但許多公司將在此基礎上構建偉大的產品。 然後它最終會滲透到幾乎所有產品中,但你不會一直想着在使用晶體管。 所以是的,我認爲很多人會建立真正成功的公司,建立在這項令人難以置信的科學發現之上。 我希望埃隆對此少一些零和博弈的心態。
薩姆·奧爾特曼: 或者負和。 我想,如果我們這樣考慮的話,蛋糕只會越做越大。
安德魯·梅恩: 我剛剛參加了一個能源會議,與那些從事能源生產及相關工作的人交談很有趣,“超大規模化”(hyperscaling)——他們對這種情況使用的術語——是一個話題。 這確實引出了能源需求的問題。 我知道,就Grok 3而言,顯然他們不得不在停車場裡放置發電機,才能訓練那個模型。 問題在於,能源將從何而來? 錢,我能理解;但當我們談論所需的能源規模時,能源(的供應)纔是需要思考的問題。
薩姆·奧爾特曼: 我想,可以說無處不在。 我認爲目前是多種來源的混合。 最終,我認爲很多…… 我對先進核能,無論是裂變還是聚變,都感到非常興奮。 但就目前而言,我認爲這需要整個能源結構的全面組合。 對。 天然氣、太陽能,我的意思是,確實還有核能,所有一切。
薩姆·奧爾特曼: 是的,我曾和一些人交談過,他們中有些人在艾伯塔省等地區工作,他們說那裡有大量的能源可供獲取,但在當地沒有那麼多用途等等。 而這正是這樣一種我甚至從未思考過的全貌。 你知道,傳統上,大多數種類的能源都很難在世界範圍內轉移。 但是如果你將能量轉化爲智能,然後在世界範圍內轉移這種智能,就會容易得多。 所以你可以把巨型訓練中心甚至大型推理集羣放在很多地方,然後通過互聯網傳輸輸出結果。
人工智能與科學的邊界
安德魯·梅恩: 有一位在OpenAI做演講的人,我參加了一場活動,有個人正在研究,我想是詹姆斯·韋布空間望遠鏡。 他談到他最大的瓶頸是他們即將獲得所有這些,你知道的,數太字節的數據,但他沒有科學家來處理,也沒有足夠的人來梳理這些數據。 於是我們面前就有了這些關於宇宙的答案,諸如此類,這就像一個大數據問題。
薩姆·奧爾特曼: 是的,我總是開玩笑說,當我們有足夠的錢時,當OpenAI有足夠的資金時,我們應該做的就是建造一個巨型粒子加速器。 並一勞永逸地解決高能物理問題。 因爲那將是一件非常成功、了不起的事情。 但我想知道,一個非常非常聰明的AI有多大的可能性,只查看我們目前擁有的數據,不再需要更多數據,也不需要更大的粒子加速器,就能把它弄明白? 這並非不可能。
安德魯·梅恩: 是的,所以就出現了這樣一個問題,那就是:現在已經有大量數據了。 世界上有很多聰明人,但我們不知道智能能夠發展到何種程度。 如果不再進行實驗,我們還能發現多少? 是的,我記得讀到過一篇文章,裡面談到在1990年代早期,有人發現了一種類似司美格魯肽的藥物,並將其提交給一家制藥公司,但他們說,不,我們不採納。 而那卻成爲了一種改變人生的藥物,例如對於那些患有慢性肥胖症的人來說,它將改善他們的生活質量。 而你會想,哦,這東西就那樣擱置了25年。
薩姆·奧爾特曼: 我懷疑我們還會發現許多其他例子,或許我們已經擁有已知有益的現有藥物,但它們能以某種重大方式被再利用,或者只需進行少量修改,我們就能非常接近某個偉大發現。 聽到科學家們甚至正在使用當前一代模型進行這類工作,這非常令人振奮。
安德魯·梅恩: 聽起來,我們下一代模型將需要具備的一項能力是理解物理學、化學等知識的模型。 Sora 是對這方面的一種嘗試嗎?
薩姆·奧爾特曼: 我的意思是,它會理解牛頓物理學。 我不知道它是否能幫助我們發現新化學,以及類似新穎物理學或新穎理論物理學等等你喜歡的東西。 但我認爲,我們用於推理模型的技術將對這些方面大有幫助,對此我持樂觀態度。
安德魯·梅恩: 那麼,推理模型的工作原理,與我直接向GPT 4.1提問有什麼簡短的區別定義呢?
薩姆·奧爾特曼: GPT模型本身就具備一定的推理能力。 事實上,在GPT模型早期,最令人興奮的發現之一就是,通過告訴模型“讓我們一步步思考”,就能獲得更好的性能表現。 然後,它就會輸出逐步思考的文本,並得到一個更好的答案,這種方法竟然有效,這本身就有些令人驚訝。 而推理模型只是將這種能力進一步推進。 所以它的理念是,當模型能夠分解問題時,它就能在每一步上投入更多時間。 當你問我一個問題時,如果問題非常簡單,我可能會幾乎本能地反射性地立即給出答案。 但如果是一個更難的問題,我可能會在腦海中思考,進行內心獨白,並自言自語:“我可以這樣做或那樣做,或者也許這樣會更清楚。”我對此不確定。 我可以回溯並重新審視我的步驟。 然後,當我思考完畢,並且我一直是用英語思考的,我就可以列出一些要點,然後以英文形式向您輸出一個答案。
安德魯·梅恩: 現在,當我使用這個應用時,我觀察到一件有趣的事情是,如果我提出一個深入的研究問題或類似的問題,然後我切換到鎖屏界面,我會看到它仍在處理和思考。 我聽說有另一家公司,我忘了是哪家了,正在使用一個衡量某事物耗時多久的指標。 我想是Anthropic,他們說:“嘿,這個模型實際花費了15分鐘或30分鐘或任何時長來思考某件事,”這是一個好的衡量指標,但它確實需要爲您提供正確的答案。
薩姆·奧爾特曼: 我認爲那是一種有趣的範式……我感到驚訝的一點是,人們竟然出奇地願意等待一個出色的答案,即使模型需要思考一段時間。 我所有的直覺都告訴我,對重要的事情應該即時響應,並且用戶討厭等待。 而在很多情況下,這是真的。 但對於那些有非常好答案的難題,人們則非常願意等待。
人機交互的未來:新硬件與新範式
安德魯·梅恩: 是的。 那麼,我們擁有所有這些工具,所有這些東西。 到目前爲止,我用的是我的手機。 而現在,OpenAI 剛剛宣佈你們正在開發硬件。 你們發佈了一個視頻,你和喬尼·艾維(Johnny Ive)在其中談論了你們已交流協作數年。 顯然,你不能……我的意思是,嗯,我可以問你,它現在在你身上嗎?
薩姆·奧爾特曼: 還需要一段時間。 好的。 我們將嘗試達到一種極高的質量水平。 而這並非一蹴而就。 但計算機,包括軟件和硬件,以我們目前所理解的方式,是爲沒有人工智能的世界而設計的。 而現在,我們正處於一個截然不同的世界。 你對硬件和軟件的需求也正在迅速變化。 你可能想要一些能更深入感知環境、在你的生活中擁有更多語境信息的東西,你可能想以不同於打字和看屏幕的方式與它互動。 我們已經對此探索了一段時間。 我們有一些令我們非常興奮的想法。 我認爲人們需要時間來適應在這種世界中使用計算機的意義。 因爲現在一切都變得如此不同。
但是,如果你真的信任一個AI,讓它理解你生活和問題的全部語境,並代表你做出良好判斷,比如讓它參加會議,聽完整個會議,知道可以與誰分享什麼,不應該與任何人分享什麼,以及你的偏好是什麼,然後你問它一個問題,你信任它會與合適的人進行正確的後續跟進並行動,那麼你就可以想象一種截然不同的使用電腦來達成目標的方式。
薩姆·奧爾特曼: 我的意思是,你也可以說,我們與ChatGPT的互動方式受到了上一代設備的塑造。 所以我認爲,這是一種協同進化的事物。
安德魯·梅恩: 但願如此。 讓手機如此普及的原因之一是,我可以在公共場合看屏幕。 我可以在私人場合打電話並與它交談。 我認爲,新設備面臨的挑戰之一就是如何彌合我們在公共和私人場合使用方式之間的差距。
薩姆·奧爾特曼: 手機是了不起的東西。 我的意思是,它們確實在很多方面都非常出色。 並且你可以想象一款可以在任何地方使用的新設備。 但同時,有些事情我在公開場合和私人場合確實會做得不一樣,比如在家裡,我有一套很棒的立體聲音響系統來聽音樂。 而當我在外面行走時,我使用AirPods,這並不困擾我。 所以我認爲在公共和私人使用場景中,有些事情是不同的。 但我同意,通用性很重要。
安德魯·梅恩: 是的,它會隨身攜帶。 所以在明年之前可能都還沒有。
薩姆·奧爾特曼: 還需要一段時間。 我希望等待是值得的,但還需要一段時間。
安德魯·梅恩: 好的。 我很興奮,也很好奇。 我有一些想法。
給未來一代的建議
薩姆·奧爾特曼: 我的意思是,那些顯而易見的戰術性內容可能正是你期望我說的,比如,學習如何使用人工智能工具。 有趣的是,世界如此之快地從告訴普通的二三十歲年輕人“學習編程”變成了“編程不重要,學習使用人工智能工具”。 我想知道接下來會是什麼。 但當然,接下來肯定還會有新的事物。 但那是,那是很好的戰術性建議。 然後在更廣闊的層面上,我相信像韌性、適應能力、創造力以及洞察他人需求這樣的技能,我認爲這些都是出人意料地可以學會的。 而且這不像去練習使用ChatGPT那麼容易,但它是可以做到的。 我認爲這些技能在未來幾十年內將帶來豐厚的回報。
安德魯·梅恩: 更多。 是的,我看到很多網民都在說:“哦,他們太厲害了。”他們爲什麼還在招人? 我說,因爲電腦不能做所有事情。
薩姆·奧爾特曼: 它們也做不了所有事情。 稍長一點的、不止一個詞的答案是,屆時將會有更多的人,但他們每個人所能做到的將遠超,你知道,在通用人工智能(AGI)問世之前一個人所能做到的。
安德魯·梅恩: 對。 而這正是技術的目的。