OpenAI首席產品官凱文·威爾最新深度解讀AI智能體的未來 | 2萬字+視頻
文:Web3天空之城| 未經許可不得轉載
【城主說】如主持人所言, 在這次訪談開始前的一小時,OpenAI再次進行了一系列產品發佈。這種緊湊的迭代節奏已成爲AI競賽“場上選手”的常態-如果沒能保持這種節奏,那恐怕就不是AI主要玩家了。
作爲幕後推手,OpenAI首席產品官凱文·威爾(Kevin Weil)在這次訪談裡再次闡明瞭ChatGPT的演進藍圖:它將不再是一個被動的問答“先知”,而是能夠接入你的個人與企業數據,主動爲你執行現實世界任務的智能“員工”。
終極願景:從“先知”到“員工”的進化
長久以來,我們習慣於將ChatGPT視爲一個無所不知的先知(Oracle),我們提問,它回答。然而,凱文·威爾指出,這僅僅是AI能力的初級形態。OpenAI的真正目標,是將其打造成一個能夠理解上下文、接入工具、並主動執行多步驟複雜任務的智能代理(Intelligent Agent),其角色更像一個高效的數字員工。
這一轉變的基石,在於將模型與用戶真實的工作流和數據源打通。最新發布的連接器,允許ChatGPT接入Google Docs、SharePoint、Gmail等關鍵生產力工具,意味着它終於獲得了與人類員工同等的“信息權限”。當一個AI擁有了項目的完整背景、團隊的溝通記錄和公司的知識庫,它的價值便從“回答問題”躍升至“解決問題”。這不僅是效率的提升,更是工作模式的顛覆。
與傳統軟件開發不同,OpenAI的產品路徑並非由一份清晰的產品需求文檔(PRD)主導。凱文·威爾坦誠,這是一種在不可預測性中構建未來的全新模式。他將之形容爲研究、產品與工程團隊之間的一種緊密循環,而這種模式的核心,是迭代部署(Iterative Deployment)的哲學。
外界常常對ChatGPT左上角那個“混亂”的模型下拉菜單感到困惑,但這正是其開發理念的直觀體現。OpenAI選擇將尚不完美但具備前沿能力的新模型快速交到用戶手中,以此加速學習循環。用戶的使用行爲、遇到的問題,都成爲最寶貴的評估(evals)數據,反哺給研究團隊,用以校準和改進模型。這種方式雖然犧牲了簡潔性,卻換來了無與倫比的迭代速度。
這種由研究驅動的開發模式,意味着產品團隊對未來6個月後的規劃是模糊的,因爲顛覆性的能力可能在任何一次訓練中“涌現”出來。這要求產品經理具備一項新技能:爲複雜、甚至是主觀的任務(如創意寫作)創建有效的評估體系,以此來衡量和引導模型的演進方向。
如果說讓ChatGPT成爲“員工”是宏大願景,那麼AI代理(Agent)則是實現這一願景的具體載體。凱文·威爾用新近推出的軟件工程代理Codex爲例,生動地展示了其巨大威力。他本人,一個已非全職的工程師,在深夜利用Codex,僅用10分鐘就修復了一個他從未接觸過的語言編寫的Bug,併成功提交了代碼。
這正是AI代理的核心價值:它不僅僅是工具,更是能力的延伸和放大器,旨在普及專業技能”(democratizing skills)。威爾暢想,當編寫代碼的能力從全球三千萬開發者普及到十億人時,無數在疫情期間因缺乏技術能力而陷入困境的小型組織和個人,將能在一夜之間構建起解決自身問題的工具。
對於外界擔憂OpenAI這類平臺會擠壓初創公司生存空間的“平臺悖論”,威爾引用了微軟Windows 95集成TCP/IP協議棧的經典案例。他認爲,平臺提供更強的基礎能力,是將開發者從“重複造輪子”的底層基建中解放出來,讓他們能更專注於創造真正獨特的價值。對於創業者而言,真正的機會在於在模型能力的前沿進行構建,即利用那些當前模型“勉強能用”,但下一代模型將使其大放異異彩的新能力。
在對話的最後,當被問及通用人工智能(AGI)何時到來時,凱文·威爾給出了一個冷靜而深刻的回答。他認爲,AGI的到來不會是一個“一夜之間”的突變事件。相反,它是一個我們正在親身經歷的漸進過程。正如我們所見,AI正在以驚人的速度,在越來越多的維度上超越人類。
天空之城全文整理版
主持人: 今天,我非常高興地歡迎凱文·威爾。他是OpenAI的首席產品官,此前在Twitter和Facebook等公司擁有斐然的職業履歷。有太多要談的了。凱文,首先感謝你抽出時間。你今天已經很忙了。舊金山現在是早上,你們已經發布了一些東西了。
凱文: 是的,我們是。非常感謝你們邀請我。這是我第一次參加現場Substack活動。所以我很高興。嗯,希望未來還有很多次。
主持人: 你們真的讓我們時刻保持警惕。就在我們上線前一小時,OpenAI又進行了一波產品發佈。這些發佈告訴我們什麼關於你們對ChatGPT的願景以及這款產品的走向?
凱文: 我們今天早上發佈的最重要的一件事是,我們今天早上發佈了大約六種不同的東西。但我認爲,對人工智能的長期未來而言,最重要的是我們推出了一系列連接器,它們可以連接到您的個人數據,或者,如果您是企業,則連接到您的企業數據。這些連接器可以連接到 Google Docs、Gmail 和日曆、SharePoint、OneDrive、Dropbox、Box、Linear,以及所有這些您日常用於完成工作的不同工具。隨着我們推理模型的興起,將它們連接到您使用的服務和數據中,大大提升了模型的效用。
所以不僅僅是,比如說,在工作中,如果您將其連接到您的 Google Docs 或 SharePoint,連接到您日常使用的文檔中,您現在就可以提問。突然間,ChatGPT 就能獲取所有這些關於企業、項目狀態以及任何特定事態最新情況的語境信息。在您的公司裡,您絕不會有員工是您不賦予文檔訪問權限的。那裡就像是對話、策略和其他事務的發生地。所以現在您有了 ChatGPT,它也具備了這種能力。而目前,它們是隻讀的。所以它們能夠訪問信息,但無法進行創建操作。但你可以想象未來會是怎樣。
另一個重要部分是,ChatGPT應該能夠執行操作,應該能夠幫助你撰寫文檔,製作演示文稿,或者,你知道的,將任務寫入你的任務管理系統,並最終將所有這些整合起來,開始真正像一名員工一樣工作。對。所以就是這樣。這就是線索,對吧?
主持人: 將ChatGPT從一個我們通過提問與迴應進行互動的東西,轉變爲一個更高級、感覺它真的像一名員工一樣爲我們工作的方向。我們會花一些時間深入探討。這是一個多麼宏偉的願景。
願景與感受:在AI浪潮之巔做產品
主持人: 讓我問問你。你是當今世界上我認爲最重要的公司的首席產品官。
凱文: 那麼,對你而言,日復一日、周復一週地感受如何?我覺得,這是一種榮幸。這是我工作過最激動人心的地方。在我的職業生涯中,我非常幸運,能在許多很棒的地方與非常優秀的同事共事。但我認爲,擺在我們面前的機會,以及人工智能改變我們所有人生活的速度,意味着我們有能力產生真正巨大的影響。我們對此非常重視。所以我能與傑出的同事們一起工作。我能親身見證我們的模型如何演進,以及這一切如何影響我們的生活。希望我們能開發出一些產品,爲你的生活以及所有在此聆聽的人們的生活帶來改變。
主持人: 那麼,自2022年11月以來,將近十億人至少是通過口頭傳播和指尖操作選擇了使用ChatGPT。科技總是在改變我們。電視就做到了這一點,我們有了電視晚餐和飲水機旁的閒聊。互聯網顯然以不同的方式改變了我們,汽車亦是如此。我們有了大型連鎖超市,有了郊區,有了尖樁籬笆,以及《絕望主婦》。那麼,AI產品將如何重塑我們的日常生活呢?
凱文: 嗯,我認爲當科技浪潮來臨時,另一個有趣的現象是,人們會先用新的媒介去做他們以前在舊浪潮中做的事情。你知道,最初的電視廣告就是人們站在舞臺上,宣讀他們的廣播廣告。然後人們慢慢地發現,你實際上可以製作出我們今天看到的商業廣告,它們更具互動性,也更具動感。所以,你知道,我們可能仍然處於這樣的模式中:當人們審視AI能對他們的生活或工作產生的影響時,他們會想:“好吧,我有這些流程。”我該如何將AI賦能於此,使其變得更好、更快等等。那沒關係。這都挺好的。
就像之前的技術轉型一樣,其力量來自於利用這項新技術,從第一性原理出發徹底重新構想你正在做的工作。你知道,所以移動技術並不僅僅是,你知道的,一個裝在口袋裡的電腦。它是,你知道,你可以使用GPS,並且擁有全新的通知方式以及與技術互動的全新方式。我認爲在接下來的,你知道的,一年裡,我們都將處於利用人工智能重塑做事方式的過程中。而有趣的是,這項技術發展得如此之快。不,我的意思是,它的發展速度比我職業生涯中接觸過或見過的任何技術都要快。所以即使我們正在重塑,這項技術也正在獲得新的能力。這簡直就是一個激動人心的時代。
重塑日常:AI如何改變我們的行爲模式
主持人: 我的意思是,這種變化的速度確實非同尋常。我確實如此。我今天在尋找一些東西,我知道這在四個月前是不可能實現的。所以我當時正在使用O3來幫我尋找一款小型便攜式5G移動路由器,以備我旅行時需要獲得高質量信號之用。而且,O3深入探討了射頻芯片組的所有技術規格,並說,你知道,這款較早的路由器配備了他們現在已不再使用的略微更好的高通芯片組,你將在美國的鄉村環境下多獲得一格信號,但在歐洲則不行。我坐在那裡,心想,這簡直有點瘋狂。
但我對這類行爲模式確實很好奇。你看到了你的用戶在使用ChatGPT時出現了哪些令人驚訝的行爲?薩姆已經就代際差異略作探討,但請讓我們瞭解一下你在行爲方面學到的那些產品團隊很難事先研究或弄清楚的事情。
凱文: 嗯,我確實認爲,我的意思是,薩姆談論過,就像我說的那樣,現在很多人都只是將人工智能零星地應用於他們現有的工作流程。而且,你知道,對於年輕人來說,這(指人工智能)是他們與生俱來的,而對於我們這些在沒有人工智能環境下成長的人來說,則並非如此。我的孩子們就是覺得,當然了,你可以和一個超級強大的AI對話,它能夠自行定製,並回答你提出的任何問題。如今大學畢業的那些工程師,他們寫代碼除了使用像Cursor和Windsurf這樣的AI編輯器之外,不知道還有其他什麼方式。對他們來說,這簡直是再自然不過的事了。因此,這在某種程度上賦予了他們超能力。這也是我們非常關注最年輕的用戶,比如青少年後期和大學生羣體是如何使用產品的原因之一,因爲這能教會我們很多東西。不過,你能否描述一下這些差異呢?
主持人: 那麼,如果你二十歲出頭,在使用ChatGPT時,會是什麼感覺呢?與那些可能三十多歲或四十出頭的人相比,這種感覺有何不同?
凱文: 這有點像一種‘始終在線’的特性,你只是意識到你的口袋裡有一個超級助手,它不僅能回答任何問題,還能教會你任何你想學習的東西。所以當你以這種方式生活時,我們其他人還在努力記住,努力思考我們所經歷的過程,以及我們如何能夠重新構想它們。如果你更年輕,你可能還沒有經歷過這些過程。因此你用人工智能從零開始構建了它們。所以它就成了你生活運作方式的核心部分。在某些方面,他們是領先的,而我們其他人正在迎頭趕上。
建立信任:直面恐懼與迭代部署的哲學
主持人: 很多人都害怕這項技術。很多人都感到,你知道的,緊張。我剛從布魯塞爾回來,和不同行業的人交流過,你確實能感受到那種恐懼。產品中可以做出哪些改變來解決這個問題?
凱文: 我認爲非常重要的一點是,人們會問,你知道的,關於人工智能我該怎麼做?我該如何看待它?而我的答案總是,直接使用它。而且,你知道,當然,我覺得每個人都應該嘗試一下ChatGPT,但無論是我們還是其他任何公司,都請開始使用它。因爲,這是讓你認識到它並非你讀到的那種超級可怕事物的最佳方式。它只是幫助你完成更多事情。然後你就會覺得,哦,這太棒了。我,我現在有了這個令人難以置信的新工具,它可以成爲我生活的一部分,幫助我完成任務,並幫助我自動化處理我那些枯燥的工作。所以,最重要的一點就是,開始使用它。
另外,考慮到技術改進的速度,如果你現在不開始使用它,將來就更難跟上它的步伐。如果你相信人工智能將成爲我們生活的重要組成部分,那麼這班列車你就不應該錯過。所以,你知道,最重要的一點就是,開始使用它。
但隨後,你知道,我們考慮了很多,尤其是當你涉及到代理(Agents)及其他事物時,我們非常關注確保用戶處於控制之中。因此,當你在使用ChatGPT或任何其他人工智能時,你不會希望它在你不具備掌控感的情況下,擅自爲你做一堆事情。所以,如果它只是爲你回答一個問題,閱讀一些文檔並進行總結,諸如此類的事情,那是一回事。但隨着我們正從ChatGPT作爲一個回答問題的工具,向一個真正在現實世界中爲你執行任務的產品過渡,你理應掌控它所採取的任何行動。隨着時間的推移,當模型變得更好,你開始更加信任它們時,當然,你可以給予它更多的自主權,並信任它能自主地執行更多行動。但在每一步,你都應該掌控它。我認爲這是我們尋求建立信任的最重要方式之一。
主持人: 我的意思是,當你轉向越來越多基於代理的工作流時,會有很多改變,模型將能夠使用那些我想我們必須共同演進的工具。我認爲我們絕對應該深入探討這些問題。我只是好奇你自己的經驗。我們很多人在使用大語言模型時,都會有那些令人震驚的時刻,對吧?有些非凡的事情發生了,或者你兩年的心血在五秒內得到了回報。使用你自己的產品時,你最近一次感到“大受震撼”的時刻是什麼?
凱文: 嗯,那我給你講一個,這個可能有點……務實吧,但對我來說意義重大。我們剛開始的時候,大家都在聊孩子。我們其中一個兒子做了一個小手術。而且這本來是一件所有跡象都表明不會有什麼大礙的事情。但也有很小的可能性,情況會非常糟糕,你知道的。所以他們做了手術,然後取了樣本去活檢。然後你就在等待結果。作爲父母,你會很緊張,即使你從邏輯上知道,情況不好的可能性非常小。某天,我們收到一封郵件,上面有許多看起來相當令人不安的醫療文件,說實話,上面有很多我看不懂的詞。它只是在說明這是什麼,但並沒有告訴我是否應該爲此擔心。它只是作了說明,然後就結束了。我聯繫不上那位醫生。她可能在做手術什麼的。於是我當時就想:天哪,這是什麼意思?於是我拍了一張照片。我把它放進了 ChatGPT。我問它:我應該擔心嗎?我又問它:你能給我解釋一下嗎?比如,我5歲。而聊天機器人做到了,它說,不,這完全沒問題。一切都像沒什麼可擔心的。而我實際上最終有72小時都沒能聯繫上醫生,因爲她實在太忙了。如果我只是坐在那裡悶悶不樂,那72小時對我這個家長來說會是糟糕透頂的72小時。而ChatGPT能夠給出答案,這就好比,你知道,我們這些擁有優質醫療服務的人。你想想這在全世界範圍內,那些沒有同樣醫療資源可及性的人羣身上會產生多大影響。它確實非常強大。我認爲這有點是ChatGPT被低估的一部分。
主持人: 我的意思是,那確實是一個很棒的故事。很高興你兒子健康,並從那次經歷中恢復過來。嗯,但這同時也說明了這款產品的強大之處,對吧?這是一款非常複雜的產品。我不能不問你,這款複雜的產品是如何出現在ChatGPT左上角那個有趣的下拉菜單裡的。你們在這方面也一定有什麼高明之處。你們內部一定有個笑話,關於“我們應該怎麼排列它呢?下一個叫什麼呢?”那裡到底發生了什麼?還有,如果趕時間的話,我們是不是都應該直接用03和40呢?
凱文: 這是一個完全合理的問題。你們也可以,你們能夠,而且你們應該嘲笑我們的命名。這在某種程度上也是理所當然的。所以我們有這種迭代部署的理念,即這些模型——我認爲人工智能將改變我們所有人,它將改變世界,它將改變社會。我們相信,實現這一目標的最佳方式是共同演進,是將這些模型發佈出去並交到人們手中,幫助他們理解。此外,你們知道,他們也幫助我們發現模型的能力、弱點及其他方面。因此,我們得以共同學習,並能夠非常快速地迭代和改進。
這就是其中一部分原因。另一部分原因在於,我們正在不斷構建許多新功能。如果我們花時間只做,你知道,我們只有一個模型,而且我們必須將所有東西都構建到這一個模型中,那麼我們最終的進展會慢很多。當然,那樣事情會更簡單。但我們最終會進展慢得多,因爲有時構建一個具有特定能力集的新模型更容易,它可能擅長某些事情,但不擅長其他事情。這樣一來,你就擁有了一個能做很多事情的模型集合。每個獨立模型都有其優點和缺點。因此,我們基本上優化了速度,讓人們能夠更快地獲得更多功能,但代價是會帶來一些困惑。
隨着時間的推移,當我們對一些新功能獲得更多控制權、更好地理解它們時,我們就會將其重新整合到核心模型中。因此,你擁有像GPT-4這樣能夠很好地完成很多事情的模型。而且你知道,這正是我們計劃在即將推出的GPT-5上所做的:吸取我們所學到的很多經驗,並將更多功能整合到一個單一模型中,以便人們更容易理解和使用。這就像是,我該用哪個模型?只需使用GPT-5。而且你知道,在一個理想世界中,它會了解你所提問題的難度。因此它知道是應該給你這樣一個答案,還是應該先思考一段時間。而你知道,那正是我們所追求的目標。
主持人: 所以,在某種程度上,這正在減輕目前用戶身上的認知負擔,因爲我會坐在那裡思考,我有時間嗎?這是個複雜的問題嗎?它需要調用推理模型O3嗎?它需要爲O3提供一個稍長的提示詞嗎?因爲如果我給它一個稍短的提示詞,它可能會誤解。而在某種程度上,你所說的正是將所有這些進行整合,並將其內置到模型本身中。
凱文: 是的。瞧,我不想做的是過度承諾,然後說,哦,將來我們只會有一個模型,一切都會變得簡單。因爲我們,我們也是,比如說我們推出了GPT-5,在那之外我們還會有一系列新的能力,我們正在努力構建並進行實驗。我們希望將這些能力提供給人們,進行迭代部署等等。所以我預計總會出現這種現象,即有新的模型出現。然後,你會有一些主力模型,同時也會有一些新的模型,它們擁有某些前沿能力,我們正在一起進行實驗和學習。隨着時間的推移,當這些模型成熟後,它們最終都會被整合回單一模型中。
研發揭秘:在不可預測性中構建未來
主持人: 所以,很多速度似乎都與完成循環有關,也就是學習循環。你只需同時運行所有這些模型。這樣你就能收集到足夠的數據,瞭解哪些模型對哪些能力有效。以一種有助於你開發並實現GPT-5的方式。我希望你能和我們分享這些數據。精確到分鐘。精確到分鐘。是的,這樣我們就能給自己計時了。但這是否也意味着,模型的各項能力還需要多久才能交付?那麼,現在正在開發的一些功能,是否要到2026年年中才能融入到模型中?
凱文: 是的,這是個好問題。在這裡工作最有趣的一點就是,你對即將發生的事情會有些瞭解。而且,我不是研究團隊的成員。所以我是在與研究人員合作的過程中瞭解到這些的,我想說,在產品方面,我們對未來三個月內即將推出的內容有相當清楚的瞭解,對未來六個月的內容可能就比較模糊了。而在那之後,就更難說了,你知道,你確實掌握了某些能力,也確實瞭解一點點,但你只能隱約從迷霧中看到一些未來的發展。有時候,能力是,你知道,這是研究,對嗎?所以這不像你只是擁有一個公式,然後機械式地操作就行,我們正在發現新事物,而且這是不可預測的。因此有時事情會比預期耗時更長。其他時候,你會看到這些你完全沒預料到的、某種程度上是涌現出來的能力,然後突然之間,某個東西就奏效了。
你能舉一個剛剛就奏效了,而且你沒有預料到的例子嗎?嗯,我的意思是,深度研究就是一個有趣的例子,有一段時間,少數研究人員在思考,就像是,好的,我們或許可以使模型能夠進行這種迭代式的研究,你知道,通過深度研究,你給模型一個任意複雜的查詢,讓它去研究可能需要你一週時間才能完成的事情。然後它會去進行大約100次搜索,但不是一次性全部進行,它會進行三四五次,然後對返回的結果進行推理,嘗試理解它們如何與你所問的問題相關,以及還有哪些空白。然後它會去進行更多的搜索,也許會再次思考,也許在思考的同時它會編寫一些代碼,然後繼續做更多事情,你知道的。所以這是一種迭代式的過程,我的意思是,這正是如果你被要求撰寫一份非常複雜的調研報告時你會做的事情,你不會(直接寫),你會先去做一些研究。
主持人: 抱歉,凱文,我不再那樣做了。我只是深入研究,而我實際上想不起自己該如何獨立完成。但是的,我明白了,對嗎?你必須,你得一點點摸索過去,找出探索策略,走入死衚衕再折返。
凱文: 是的。所以關於你的問題,就像那樣,一些人覺得,好吧,這正在逐漸成形。但並不清楚它到底何時能完全成形。就像我們能做到的那樣。因此,有一小隊研究人員,他們就是相信這一點,並致力於將其變爲現實。而且,你知道,有段時間,它還不夠好,它還不夠好。然後,你知道,有了一些進展。突然間,你會覺得,好吧,這已經足夠好了。在那個時間段的某個時候,我們還安排了一個產品與工程團隊與他們一起進行工作。然後你就擁有了我認爲是OpenAI真正神奇的地方:當一個研究團隊和一個產品與工程團隊,你知道,齊聚一堂,共同發揮他們獨特的技能,並且你,你理解你正在努力解決的問題。所以你會提出使用案例,並創建評估和基準,以衡量你在這些使用案例中是否成功。研究團隊則採納這些信息,並利用其改進模型本身。於是你就形成了模型朝着特定產品改進的這種緊密循環。而,你知道,我認爲我們最好的產品都是通過這種方式構建的。深度研究就是一個很好的例子。
主持人: 那相當,我的意思是,那是一種新穎的產品開發思維方式。我的意思是,如果我回顧產品開發的歷史,在90年代之前,在消費互聯網出現之前,產品開發常常是由工程師主導的,他們會說:“我們有了一個能做這個的新芯片。”而且你也不必費力找出能在那塊芯片上發揮作用的軟件。我認爲消費互聯網的重大突破在於將產品經理置於產品開發的核心地位。你也知道,我們討論過精益和迭代,以及如何做到高度數據驅動和以用戶爲中心。而現在我們正進入一種新模式,我將其描述爲絕非迴歸到互聯網前由產品工程主導的模式,而是某種相當新穎的事物,因爲研究人員發現了一種新的能力。然後你需要就這種能力如何進行產品化展開非常迅速的討論。然後這個詞用了“eval”,我猜它的意思是,如何衡量它,以判斷其是否確實發揮了作用。那麼,這真的是一個正在演進的新領域嗎?
凱文: 我認爲這是一種完全不同的產品構建方式。它肯定與我職業生涯中做過的任何事情都不同。而且,你知道的,在研究領域內,也存在一個連續體,不是嗎?我們的研究團隊中有一些部分,它們就是純粹的深度研究,性質上幾乎是學術性的,因爲他們只是在尋找新的突破,他們試圖找出那些從未有人……你知道,從未有人解決過的問題。而對於這類事情,你不想,你知道,你根本不希望被產品驅動,因爲你只想爲探索和基礎性突破留出大量的空間。然後是研究的另一個極端。這更多是在後期訓練方面,你在那裡真正嘗試教導模型非常出色地完成特定任務。而這些團隊往往更像是,你知道,與產品和工程團隊合作,擁有共同的目標。然後介於兩者之間的是一個譜系。我認爲我們應採取的正確方式是,我們當然不希望完全由產品主導。這不是這個地方的魔力所在。它也許也不是完全由研究主導,因爲了解你能爲人們解決什麼問題,以及我們如何能在世界上產生最大的影響,這些反饋是很有益的。儘管如此,它實際上是兩者的結合,而研究纔是真正的核心。我喜歡它,我一直都很喜歡。這是世界上最有趣的事情。而且,你知道,發展極快的計算機現在能做到兩個月前還做不到的事情,我們一直處於這種狀態。
主持人: 但當你從事研究時,它不僅僅是看一個規模法則,然後說:“哦,莎拉·弗萊剛剛又批准了 10 萬個 GPU。”因此,當訓練運行完成時,它將在六個月內能夠做到這一點。這不僅僅是這樣。但我發現一個引人入勝的問題是,你如何將這些能力與產品進行匹配?你提到了“evals”,我猜是指評估。一個評估的結構是什麼樣的?它是否取代了我們 15 年前可能擁有的舊版產品需求文檔中的內容?
凱文: 是的,某種程度上是這樣,我認爲,在某些方面,它是爲了理解模型在哪些方面表現出色,哪些方面不盡如人意。如果你將模型視爲某種智能。智能是如此多維。人們以億萬種不同的方式展現智能。一個聰明的人在某些領域可能比另一個人更出色,而在另一些領域則可能不如人。因此,一種思考評估的方式是將其視爲衡量模型在不同維度上的能力和智能的方法。所以你可以進行評估,例如衡量它在解決USAMO、奧林匹克數學競賽式問題上的能力,以及它在化學和創意寫作方面的表現。
主持人: 那麼,你們是否正在使用RKGI、Amy和GPQA這類公開基準作爲衡量方式呢?
凱文: 有些時候會用,同時在構建特定產品時,我認爲最有效的產品開發方式之一是:識別你希望模型具備的、以滿足產品需求的技能,並將其轉化爲一項評估。這樣你就能真正理解你在這方面有多出色,以及如何隨着時間的推移而不斷進步。但一個令人着迷的現象是,我們一年前用來衡量模型的那些評估,都非常刻板和明確,例如僅針對數學進行測試。而在數學中,存在一個正確答案。不過,你可以談談創意寫作的評估。而在創意寫作中,沒有答案。那麼你如何評分呢?對吧?那是一個問題。另一個問題是,當你開始承擔更復雜的任務時,你不僅僅是回答問題,你實際上是在嘗試自動化某個多步驟工作流程,而完成這項工作的正確方式可能存在模糊性。如果我,比如我是一個AI爲你預訂航班,沒有一個單一的方式來評判哪個航班是正確的;你會發現,我們在評估這項特定任務時,會遇到這些非常有趣、具有挑戰性且主觀的方式。而進行評估(如果你想至少將其自動化)的一部分是,你還需要一個評分機制,以便你能夠快速瞭解你在該評估中的表現。所以這很有趣,我認爲對於產品經理來說,隨着時間的推移,一項會變得越來越重要的技能是,爲自己正在構建的產品實際創建評估的能力。
主持人: 是的,我的意思是,這是一個方面,另一方面是前端的提示詞,因爲我們開始從這些泄露中看到——我不知道它們是真是假——有一些X賬號聲稱他們剛拿到泄露的系統提示,然後插入你喜歡的某個基礎模型或編碼工具。而系統提示詞,也就是伴隨每次查詢發出的那種結構化指令,確實相當複雜。我的意思是,它們本身現在就是一種產品了,對吧?它們長達數千詞,高度結構化,在編寫時顯然應用了策略。那麼,當你向像我這樣的人交付產品時,這種技能和能力有多重要?
凱文: 我的意思是,實際上,比人們意識到的要重要得多,我想,我希望隨着時間的推移,它變得不那麼重要。而且我認爲隨着時間的推移確實如此,就像,如果你回溯一兩年,每個人都在談論提示詞工程,它將是每個人爲了利用AI做任何事情都必須掌握的技能。你現在聽不到關於它的太多消息,也不再像那樣被談論得那麼多了。我認爲這是一件好事。你知道,理想情況下,對於任何特定的用戶來說,如果他們有問題,他們希望AI能爲他們做些事情,那麼它就變得越來越不重要。你不應該需要深入研究諸如“我是否使用了完全正確的詞?”這樣的奧秘。當我給出我的指令時,你知道,它就應該能直接工作。我認爲,提升智能的一部分在於模型能夠理解你想要做什麼,並且能很好地完成,而你無需爲此付出巨大的努力。話雖如此,提示詞仍然很重要。而且模型非常容易通過提示詞來控制。所以你知道,我們仍然會發現,當我們推出某些東西時,它沒有按照我們希望的方式在某些方面運行。很多時候,我們都可以通過提示詞來調整它,而無需回去重新訓練模型。所以,我希望隨着時間的推移使其變得不那麼必要,但它仍然是一個強大的途徑。
代理的崛起:從Codex看AI如何賦能
主持人: 嗯,這是產品發展方向的兩個途徑。但第三個是關於代理的理念,以及代理將爲我們帶來什麼。我想,我用過的OpenAI推出的第一個代理產品大概是深度研究。“代理”(agent)這個詞被廣泛使用。我的意思是,我也會使用“代理”這個詞。我的意思是,我通過你的API將一系列提示串聯起來。並且有一些邏輯可以將一份文檔通過一系列步驟處理到最終狀態。
凱文: 對你來說,“代理”意味着什麼?我們認爲代理是能夠獨立完成工作的實體。所以它不僅僅是快速的問答,而是真正在現實世界中爲你執行任務。另一個例子,我認爲深度研究就是一個很好的例子,它能夠進行數百次搜索,爲你整理出一份複雜的報告,而這可能要花你一週的時間。
另一個例子是Codex,這是我們剛剛推出的軟件工程代理。你可以這樣做,如果你有一個正在操作的代碼庫,你正在代碼庫中構建新功能或調試某些東西,你可以直接向這個代理髮出提示,比如“嘿,我需要你修復這個東西”。我希望你將這個應用到我的網頁背景上。我希望你,你知道的,構建這個新功能。它會去遍歷你的整個代碼庫,理解所有的上下文。如果你,你知道的,正在修復一個錯誤,它會去嘗試定位那個錯誤。然後它會爲你編寫新代碼,並創建一個拉取請求,就像一個差異。你知道的,這是我們需要對代碼進行的一系列修改。然後你就可以去審查代碼了。而這個智能體完成了所有工作。
所以,你知道的,我以前是一名工程師,現在業餘時間還會寫一些代碼,但我並沒有爲OpenAI寫過任何一行代碼。但有了Codex,我當時,這大概是在它發佈前幾天,我當時,你知道的,大概是晚上11點左右,正在做一大堆必須在睡覺前完成的工作。我當時想,你知道嗎,我敢打賭我現在就能修復一個 bug。於是我去找了一個看起來相對簡單的 bug,然後,你知道的,把上下文粘貼到 Codex 裡,說,你能去修復這個 bug 嗎?順便說一下,它是一種我生平從未接觸過的語言。所以如果我自己動手,會花費更多時間。10 分鐘後,我提交了一個拉取請求,它看起來很合理。我提交了它,一位真正的、合法的工程師審查後說,嗯,這看起來沒錯。而且,你知道的,現在有幾行代碼今天正在發佈,而這些代碼就是我使用 Codex 完成的。當你可以讓這個軟件代理,比如說,爲你實際解決現實世界的任務時,它就體現了這種東西的力量。與此同時,我還在寫郵件、在 Slack 上跟進,你知道的,做我日常工作中的所有事情。所以這純粹是額外增加的價值,我覺得這真的很棒。
主持人: 是的,因爲Codex處理過程需要一些時間,它必須閱讀和理解大量材料,然後進行修改。我好奇的是,這是所有開發過代碼自動化或開發者增強產品的人都會被問到的問題:那麼今天,OpenAI代碼庫中,最初有多少部分是由Codex而非人類工程師生成的?
凱文: 是的,這相當可觀。並且正在迅速增加。
主持人: 好的,沒錯。在某個有意義的範圍裡,我會去問O3,“有意義”在百分比上具體指什麼。我會得到一個很好的分佈結果。
凱文: 酷的是,你可以同時啓動10個這樣的任務,對吧?所以我們實際上努力讓你體驗到所有這些並行處理的價值,因爲,你知道,不僅僅是你只能做一件事。但是,如果你有一個Codex智能體爲你工作,爲什麼不讓10個Codex智能體爲你處理10個不同的任務呢?
順便說一句,爲了將其與之前關於評測的話題聯繫起來,評測本身也有一個非常重要的細微之處,那就是它們必須根據你正在嘗試構建的產品和你正在嘗試解決的問題進行量身定製。畢竟,編程並非一概而論,它只是整個世界中一個小的垂直領域。但即便在編程領域內,你也可以擅長許多不同類型的編程。而對於 Codex 來說,這是一個很好的例子,它讓我們去思考:“究竟哪些編程類型對我們來說是真正重要的?”在一個開發者所做的所有任務中,哪些類型的任務?我們真正希望擅長哪些類型的任務?於是我們爲這些任務創建了評測。隨後,我們在訓練模型時確保進行監控,以觀察它是否在這些方面變得越來越好。而且,你知道,你會去積累任務和示例供模型學習。但你這樣做是針對一套特定的評測,這些評測與你想要解決的一套特定問題相對應。
主持人: 在那方面,它非常注重能力驅動,對吧?然後它就涉及到,你如何進行充分的測試,既要確保你達到了你想要的水平,正確的得分水平,又要確保它不會脫軌,對吧?而且,我認爲隨着這些代理變得越來越複雜,被賦予更復雜的任務,這一點需要牢記在心。我的一個工作流程,一個非常非常簡單的流程,我希望一個代理能從一系列網頁中抓取數據並填充到Excel電子表格中。我當時使用的是某個第三方代理框架。
凱文: 它非常盡職盡責,凱文,它說:“我必須檢查我的工作”,結果它檢查了大約400次,給我留下了75美元的賬單。
主持人: 而它第一次就已經做對了,不是嗎?做對了,但卻陷入了這個奇怪的循環。所以,我認爲當我在和人們交流時,他們會說:“我們該如何控制這些東西呢?”這就是我聽到的其中一個問題。不是從那種,你知道的,人類失控的方法或層面去衡量,而是從企業可靠性的角度。我如何才能確保這不會像魔法師的學徒那樣,當我只是讓它預訂一個飛往意大利的航班時,它卻給我預訂了200個,從而失控呢?你們如何對所有這些進行測試?
凱文: 是的,我認爲這部分是爲了確保,就像我們之前談到的那樣,用戶在這裡擁有控制權。所以你應該能夠在某個時候說,嘿,你知道嗎,你已經檢查得夠多了,這樣就行了。而所有這些中另一個有趣的地方是,技術發展得如此之快,比我們習慣的技術發展速度要快得多。我們習慣於事情需要數十年才能部署並真正實現規模化。你在人工智能技術中看到的一個現象是,總會有一些基準,一些評估,人工智能就是無法攻克。人們會說,哦,人工智能就是做不到。然後有一天,有人發佈了一個模型,在那個評估中得了大約5%的分數,雖然仍然基本上無法完成這項工作,但就像是開始掌握了。然後你不可避免地會發現,大約兩個月後,就有一個模型在那個評估中達到了30%。然後四個月後,就出現了一個達到60的模型。然後,你們知道,在六個月內,它就完全飽和了。模型非常擅長那種新技能,並且將永遠如此。所以你非常迅速地從存在性證明,轉變爲“哦,是的,AI模型當然能做到”。這種發展速度,我認爲,仍然是我們尚未完全適應的東西。
主持人: 就是最初的百分之一或百分之二,對吧?那部分變得困難,那部分證明了它是可以實現的。那是萊特兄弟的“飛行者”號。然後在30年內,我們就能運送大量乘客橫跨大西洋了。但在這種情況下,它是在30天內完成的。
生態與未來:平臺、硬件與通用人工智能
主持人: 所以我想問一下關於編碼和編碼智能體的問題。那麼如果你看看生成式AI應用的發展,幾個星期前Similarweb發佈了一些數據,你會發現,基準是通用聊天機器人每季度增長25%。那就是,你知道的,ChatGPT等。幾乎所有其他產品類別,包括圖像生成、視頻生成、音頻生成,其增長速度都慢於此,或者規模正在縮小。我認爲這就像吞噬了你們核心模型能力的黑洞。根據Similarweb的數據,唯一增長更快的類別是編碼,每季度增長75%。我很好奇,你們選擇編碼是出於商業角度嗎,因爲你們確實看到了需求,並且開發者總是樂於嘗試?還是說你們選擇編碼是因爲它是一組可測試、結構化、可驗證的輸出,比那些模糊、無定形、充斥着世界其他領域的任務要稍微容易一些?
凱文: 是的,這是一個很好的問題。實際上,編碼是一個垂直領域,它兼顧了所有這些因素。首先,你知道的,這對我們來說非常重要,因爲如果我們可以加快編碼速度,如果我們可以讓每一位工程師更有效率,我們自己也會更有效率。因此,我們可以構建得更快,我們可以更快地將AGI(通用人工智能)帶給世界。所以從這個角度來看,這很有趣。這是通往AGI本身道路上一個明確的里程碑或步驟,因爲它是一種非常通用的推理。這也是一個相對容易評估的任務,就像你可以判斷一樣,比如在數學或其他領域,如果你得到了正確的答案。這也是我們的工程師所熟悉的。因此,這是一個他們理解並有良好直覺的問題空間。這也是一個巨大的市場,正如你所說的。這也是一個充滿了早期採用者的市場。你知道的,技術人員正積極投身於此。相對而言,它也算是開放且不受監管的。這不像試圖進入醫療或其他什麼行業,你知道,那裡有各種其他你必須做的事情。因此,所有這些有趣事物的聚合使得編程成爲一個非常有趣的市場。我雖然沒有看到那些數據,但我完全相信。
主持人: 那麼,在編程領域內,您是否已經看到爲像您這樣,技術上已不再是工程師的人提供服務的跡象了?換句話說,我們看到市場通過這些工具實現了擴張?
凱文: 哦,是的。我認爲將編程普及到全世界將會帶來巨大的價值。全世界大約有 3000 萬開發者,或者類似的數量,這取決於你如何定義,這很棒。那是非常多的人。但試想一下,如果十億人都會寫代碼呢?我前幾天和一個人聊天,他告訴我他們在新冠疫情期間。他們在當地縣政府工作,試圖將疫苗之類的東西分發給民衆。他們當時正試圖搭建一個網站進行追蹤,以便人們可以註冊並進行一些基本操作。而全世界都非常忙碌。他們就是做不到。他們無法創建網站,他們不具備相關的技能。結果,他們的管理效率較低,在每個人都忙得不可開交的時候,做了大量的手動工作。他當時就在說,你能想象嗎,如果我當時有這些工具,我們就能在一夜之間創建一個網站,它就能直接運行了。而且,你知道,他們就能更有效地完成工作了。當你放眼全球時,你會發現這種情況出現百萬次。所以我的意思是,這實際上是關於編程的另一個我覺得極其有趣的地方。這可能就是編程之所以好,因爲它是一種通用技術,或許是第九個原因。如果你你能編寫代碼,那麼你就能創造各種各樣的東西。因此,十億人能夠編寫代碼這個想法,確實蘊含着某種強大的力量。
主持人: 但我認爲,它也表明了這可能從根本上改變軟件行業,就像互聯網改變軟件行業一樣,不僅僅是因爲打包和分發,還因爲我們與您的社交技術互動的方式,對吧?我的微軟Word,當它還在軟盤上時,從未允許我像在谷歌文檔上那樣與他人交換筆記。其中一個大問題是,作爲一家正在構建性能最強模型的平臺公司,您會爲初創公司留下多少發展空間?我記得微軟在Windows 95或97中引入了磁盤壓縮功能,當時有大量提供磁盤壓縮的第三方公司隨即就倒閉了。每當你發佈新的基礎模型時,X上就會發生類似的事情。感覺凱文每發一條推文,就有另外 50 家初創公司倒閉。他們的空間在哪裡,對吧?他們在軟件世界、在 AI 軟件世界中,能夠免受你和其他公司正在構建的基礎模型不斷增強的能力威脅的空間在哪裡?
凱文: 史蒂文·辛諾夫斯基有一次給我講了一個有趣的故事,史蒂文以前在微軟負責 Windows、Office 以及所有一切業務。他當時給我講了一個關於從 Windows 93 過渡到 Windows(或者當時它叫什麼來着)再到 Windows 95,也許是 Windows 3.1 的故事,那時就像是互聯網的開端。而且,當時大多數人還沒有使用互聯網。而且如果你想用 Windows 3.1 真正接入互聯網,你得去某個,你知道,俄勒岡大學教授的網站下載一個 TCP/IP 協議棧,自己編譯,然後,你知道,安裝一些設備驅動程序,然後你才能真正上網。然後在 Windows 95 中,當然,互聯網正在興起。他們就說,好吧,我們需要將這些東西隨 Windows 一起發佈。於是他們就這麼做了。就像你當時說的,有很多人會覺得,嘿,既然你已經,就像,把那個某某大學教授的工作,他做了所有這些研究,而現在你卻直接發佈了,真是的。史蒂芬的觀點是,你絕不會想生活在一個這樣的世界裡:在今天,你仍然需要去某個教授的網站下載一個TCP/IP協議棧並自己編譯才能讓它運行起來。你只是想使用互聯網。
基本上,平臺的用戶期望,消費者對平臺的期望,是時間的遞增函數。如果平臺能提供更多技術,如果你看到爲了構建人們真正想要構建的東西,有10家不同的公司不得不去構建完全相同的底層基礎設施,那麼你可能就應該直接提供那部分,這樣那10家公司就可以去做更有趣的事情。我一直記得那個故事。它確實深深地影響了我。因爲我認爲人們將對這些平臺抱有越來越高的期望,這是一個非常真實的事實。但其中的好處都歸於第三方,對於這個世界中的開發者而言。因爲如果平臺提供更多的構建模塊,那麼他們就可以在這些構建模塊上花更少的時間去重複造輪子,而將更多時間花在那些他們真正、獨特地能增加價值的事情上。人工智能將徹底改變我們生活中的一切,你所能想象的任何行業、任何垂直領域、任何地域,人工智能都將觸及。所以我認爲,對於開發者而言,有巨大的機會去重塑和重新構想。我認爲,我們在平臺方面所能做的任何事情,通過簡化更多構建模塊來幫助加速這一進程,我們都應該去做。
主持人: 那麼,假設我20歲的兒子想在OpenAI的基礎上構建一款產品,他去哪裡構建會是好的選擇呢?
凱文: 我的意思是,幾乎任何地方都可以。機遇無處不在。薩姆有一次說了這句話,它讓我記憶猶新。他說,如果你正在創辦一家公司,並且你正在模型能力的前沿進行構建,如果你正在構建一個勉強能用,並且你迫不及待地等待我們下一個模型的產品,因爲你知道它會讓你的產品大放異彩,那麼你很可能就處在正確的方向上。因爲你正在向世界引入新事物,你就像在讓以前不可能的事情變爲可能。那就是你想要達到的境界。如果你正在圍繞當前模型構建某種掩蓋其弱點的腳手架,並且實際上害怕我們的下一個模型,因爲它可能不具備那些同樣的弱點,那麼這不是一個好的構建方向。因爲平均而言,模型將改進得非常快。一個模型上的弱點在下一個模型上將不再是弱點。所以,我認爲應該構建的,正如我們一開始談到的,是從第一性原理重新構想用例,用AI從零開始構建它們。如果你處於一種你對下一個即將推出的模型感到興奮的境地,因爲它將使你的產品大放異彩,那是一個非常好的境地。
主持人: 那是一個絕佳的啓發式方法,實際上,如果你是一位創業者,可以思考一些當前模型尚不具備能力,但在不久的將來會具備能力的東西。你可以基於這種能力進行構建。談到產品,就不能不提到你的新產品搭檔,喬納森·艾維。所以,請告訴我們那張可愛的黑白照片發佈時,辦公室裡的氛圍是怎樣的。
凱文: 哦,大家無比興奮。我的意思是,你怎能不呢?比如,我整天都在使用約翰尼設計的產品。他曾參與打造我們每天使用的,一些最受珍視的產品和硬件。你怎能不想和他一起工作呢?而且你知道,通過這個過程以及其他方式認識他。他還是一個如此可愛的人。對於一個取得如此多成就的人來說。他是如此謙遜、體貼、善良、溫文爾雅。然後你知道,他有時會說些什麼,你會覺得,天哪,那是一種看待世界的完全不同的方式。那讓我看到了我從未想過的事情。那麼,這種天才與優秀品格的結合體,是不是如此呢?你怎能不爲與他共事而感到興奮呢?當然,他是英國人。
主持人: 他將如何工作,他的團隊和你的團隊將如何協作?你們將如何對接?
凱文: 嗯,我的意思是,他來主要是專注於這些消費硬件產品。並且隨着時間的推移,我認爲他將在OpenAI的整體設計中發揮非常重要的作用。再說一次,我對此非常興奮。你怎能不興奮呢?喬尼·艾維要來負責你們的許多設計,你知道嗎?
主持人: 你知道,他會在某個時候處理那個下拉菜單的問題。這就像我們得到了艾維的設計精髓一樣。所以我覺得,在最後幾分鐘裡,討論一下硬件以及它如何與整體願景相互作用,是很有趣的。所以,這個整體願景,某種程度上你在開頭就提到了,你談到了人工智能系統將有點像人們在家居生活中的僱員,我想,那更像是助手,我們通常沒有很多…… 我們把它看作是一個超級助手,就像一個超級助手。那麼,這與需要有一個硬件設備與之配套使用之間,有什麼關係呢?我本身就有一個硬件設備了。它挺不錯的。
凱文: 我現在正在和它對話。這更多的是一個機會。正如我們已經說過幾次的,人工智能將觸及我們生活的方方面面、日常的每一部分,以及世界的每一個角落。這意味着我認爲,有機會對我們日常使用的許多服務和產品進行徹底革新和重新構想。你知道,在某些情況下,我日常使用的很多產品都非常棒。它們可能需要根本性地改變,而且它們也應該藉助人工智能實現這種改變。如果它們不改變,就等於沒有利用我們現有的所有這些驚人的新能力,尤其是在這些能力在12個月、24個月、36個月後將達到的水平。所以我認爲這裡有機會進行徹底革新和重新構想。這在軟件方面和硬件方面都是如此。所以你知道,我們對此將如何發生有一些想法。顯然,約翰尼對此進行了深入思考,我們也很期待看到我們能共同創造出什麼。
我相信還會有許多其他人在這個領域進行開發。這也是我們爲何對我們的API和開發者平臺投入如此多精力和關注的原因之一。因爲,你知道,世界不僅僅是OpenAI,世界上將會有很多優秀的初創公司、老牌企業以及其他所有人利用人工智能打造非常棒的產品。我們希望爲其提供動力。無論如何,你知道,其中一些將是我們自己構建的第一方產品,另一些將是其他人利用我們的模型構建的產品。而且你知道,這兩類事物對我們來說都非常重要。
主持人: 我的意思是,我明白你的意思,我感同身受,因爲我已經開始意識到手機作爲與模型交互的形態的侷限性了,你無法真正向O3輸入一個較長的提示詞。我非常依賴與它對話。如果我在嘈雜的地方,那樣就行不通。身邊環繞着環境智能的設想,我總是有一個人工智能模型在監聽我的會議,並且我經常與它們對話來完成我的工作。所以你開始看到,一個擁有手機功耗、手機尺寸,並且還兼顧其他功能的東西的侷限性。因此,那將是一個非常激動人心的機會。還有,請幫我報名參加內測。
在正式發佈之前,我們還有幾分鐘時間,我想提出幾個問題。中國頂尖的AI公司在覈心基礎模型能力方面落後多遠?
凱文: 不像以前那麼落後了。我認爲作爲美國的AI實驗室,我們必須非常清楚這一點。我認爲非常重要的是,我們大家使用的那些領先模型,都應是基於民主原則而非威權主義原則構建的。我們對此非常重視。
主持人: 市面上有沒有一款不是由OpenAI構建的AI應用,無論是中國的還是其他地方的,是你非常喜歡,並且喜歡使用和把玩的?
凱文: 我的意思是,我覺得很多視頻應用都超級有趣。我也覺得Waymo很神奇。這是我用來舉例說明人工智能如何影響我們生活的一個常用例子。你知道,再說一次,就像自動駕駛技術,曾有10年都像是“還有兩年就實現了”。而現在突然它就在我們身邊了,並且運行良好。它將改變很多。
主持人: 這簡直是魔術般的存在。你是一名狂熱的跑者。我很好奇你是否擁有佳明或頌拓手錶,以及你希望人工智能能爲你的運動追蹤器帶來哪些目前還沒有的功能?
凱文: 哦,這是個好問題。實際上,我主要使用的是蘋果手錶。然後,如果我參加像一百英里那樣的比賽,它的電池就不太夠用了。所以我將使用佳明設備。我想要什麼?我認爲實際上我想要的一件事是更好的指導,哪怕只是一點點。而且我認爲人工智能完全有能力做到這一點。我認爲Strava在這一方面有一些正在研發的功能。但我很樂意看到更好、更專業的指導,比如人工智能能分析訓練數據之類的,這樣一來,我認爲大多數用戶就有可能從人工智能那裡獲得目前只能從專業教練那裡得到的分析。我感覺這種事情,你知道的,五年後我們就會覺得,哦,天哪,我甚至無法想象它曾經不存在。但它目前纔剛剛嶄露頭角。
主持人: 只是一點點。但我確實明白你的意思。我認爲擁有那種個性化輔導的可能性將會相當出色。那麼最後一個問題,你們什麼時候會交付通用人工智能(AGI)?哈哈,我們每天都在爲此努力,每天都離目標更近一點。
凱文: 我的意思是,我們什麼時候會知道?我們會知道嗎?我認爲,你看,我認爲這就像我們之前討論過的,智能是多方面的。如今在很多領域,人工智能已經遠勝於人類。而在另一些領域,人工智能卻比人類差得可笑。但你知道,大約每個月或每隔一段時間,當有新模型出現時,其基礎能力就會逐步提升。並且在越來越多的事情上,人工智能正變得超越人類。在某個時刻,它將在絕大多數領域都超越人類,屆時我們將會那樣稱呼它,但這並非一蹴而就。我認爲這不像我們某晚睡下時還沒有通用人工智能,一覺醒來通用人工智能就出現了。這是一個人工智能在越來越多的方面變得越來越強大的漸進過程。
主持人: 好的,帶着這個想法,凱文,你繼續攀登那座山吧。今天早上非常感謝您抽出寶貴時間。很高興能邀請到您。感謝您的邀請。