YC總裁最新專訪Cursor CEO:超越代碼、超級AI智能體,以及爲何品味依然重要 |1.5萬字全文+視頻
文:Web3天空之城| 未經許可不得轉載
【城主說】YC今天發佈了其總裁Garry Tan(陳嘉興)對當紅AI編程一哥 Cursor 的創始人CEO 邁克爾·特魯爾(Michael Truell)的訪談。邁克爾·特魯爾分享了Cursor的終極目標——用一種更高級、更直觀的方式徹底取代傳統編碼,並揭示了其在AI時代構建產品護城河的獨特見解,以及對未來軟件工程師核心價值的深刻思考。
核心觀點
• 終極目標是取代編程 :AI的未來不是輔助編碼,而是發明一種全新的、更高級的軟件構建方式,讓人們只需描述意圖即可。
• “品味”是工程師不可替代的價值 :當AI處理實現細節後,工程師的核心競爭力將轉變爲對產品方向、邏輯運作和美學的高層次“品味”。
• 構建編輯器而非擴展 :爲了真正革新編程體驗,必須控制整個用戶界面。構建一個獨立的編輯器,而不是受限於現有平臺的擴展,是實現顛覆性創新的關鍵決策。
• 數據飛輪是核心護城河 :在AI時代,真正的護城河類似於早期的搜索引擎,即通過大規模用戶分發獲取數據,理解用戶行爲(如接受、拒絕、修正代碼),從而不斷迭代優化產品和底層模型。
• 順應AI發展曲線 :公司戰略應建立在“AI模型將持續變得更強大”這一預判之上,提前佈局,以抓住技術浪潮帶來的顛覆性機遇。
與衆多AI編程助手致力於“輔助”開發者的定位不同,Cursor的最終目標顯得更爲宏大和顛覆。特魯爾明確表示,他們的使命並非簡單地提高編碼效率,而是要從根本上取代編程這一行爲本身。
他認爲,儘管目前的AI主要扮演“助手”角色,幫助開發者編寫了約40%到50%的代碼,但這只是過渡階段。真正的未來是,開發者將從繁瑣、晦澀的編程語言中徹底解放出來,只需通過更接近自然語言的方式描述意圖,軟件即可被構建和修改。Cursor的戰略是在當下成爲最好用的AI編碼工具,並最終引領這場從“編碼”到“意圖表達”的範式革命。
二 | 工程師的未來價值:“品味”將是不可替代的核心競爭力
當AI越來越多地接管“如何實現”的底層工作後,什麼將成爲工程師最有價值的技能?特魯爾的答案是:品味(Taste)。
這裡的“品味”超越了視覺美學,深刻地指向一種對軟件邏輯的高層次判斷力——即對“應該構建什麼”以及“它應該如何運作”的正確直覺和深刻理解。他將許多繁瑣的編碼工作比作“人工編譯”,工程師需要費力地將高層次的想法翻譯成機器能夠理解的語言。隨着AI自動化這一過程,決定產品成敗的關鍵,將更多地取決於這種高層次的構想和設計能力。
這意味着,未來工程師的核心價值將從精通語法和算法細節,轉向擁有卓越的產品感、邏輯設計能力和對方向的精準把握。
三 | 關鍵戰略決策:自建編輯器,而非受限的擴展
在產品形態上,Cursor早期做出了一個在當時並非共識、甚至招致批評的決策:構建一個獨立的編輯器,而不是開發一個依附於現有IDE(如VS Code)的擴展程序。
這個決策源於他們對未來的一個核心預判:AI將徹底改變編程的交互形態。如果僅僅是做一個擴展,將永遠受限於宿主平臺的API和界面限制,無法實現真正顛覆性的創新。爲了完全控制用戶體驗,併爲未來更高級的交互範式(如直接操作UI、更高階的邏輯語言)鋪平道路,擁有自己的“畫布”至關重要。
事實證明,這一決策爲Cursor的快速迭代和功能創新提供了巨大的自由度,是其能夠超越衆多競爭對手的關鍵一步。
四 | AI時代的護城河:數據飛輪與順應發展曲線
在AI技術日新月異的背景下,如何構建持久的護城河是所有創業者面臨的核心問題。特魯爾認爲,AI時代的可持續競爭優勢,類似於90年代末的搜索引擎市場,其核心在於由大規模分發驅動的數據飛輪。
通過服務海量用戶,Cursor能夠收集到關於AI生成代碼的寶貴反饋——用戶接受了什麼、拒絕了什麼、以及如何修正——這些數據反過來可以持續優化其底層的定製模型和產品體驗,形成一個正向循環。
同時,他強調公司的核心戰略必須建立在 順應發展曲線 的信念之上,即堅信AI模型將持續變得更強大,並基於這一預判來佈局產品和技術路線,才能在技術浪潮的變革點上抓住顛覆性機遇。
從一個探索機械工程CAD工具的項目,到成爲AI編程領域的現象級產品,Cursor的崛起根植於其創始團隊對編程未來的“無所畏懼”的雄心。邁克爾·特魯爾相信,我們正處在一個構建能力被極大放大的新十年。未來,不僅專業開發者的效率將得到極大提升,更多的人也將有能力構建滿足自身需求的利基軟件。
天空之城全文整理版
邁克爾·特魯爾:對於我們而言,最終目標是用更好的東西取代編程。我認爲這將是這樣一個十年:你僅僅是構建的能力將被極大地放大。如果你比其他人更快地推動前沿,你就能獲得巨大的收益。創辦公司很困難,所以你不如去從事真正讓你興奮的事情。所以,是的,我們着手研究代碼的未來。
陳嘉興: 歡迎回到YC播客《如何構建未來》的又一集。今天,我請到了AnySphere的聯合創始人兼首席執行官邁克爾·特魯爾,AnySphere正是我們所熟知和喜愛的AI編程平臺Cursor的幕後公司。他們最近達到了90億美元的估值,是有史以來增長最快的初創公司之一,在推出僅僅20個月後就實現了1億美元的年經常性收入(ARR)。邁克爾,感謝你的加入。
邁克爾·特魯爾: 謝謝你們的邀請。很高興來到這裡。
陳嘉興: 您曾說過,Cursor 的目標是真正發明一種新型編程方式,即您只需描述所需,軟件即可構建完成。請您詳細闡述一下。
邁克爾·特魯爾: 是的,我們公司的目標是用一種更優越的方式取代編碼。我和我的三位聯合創始人,我們長期以來都是程序員。說到底,這就是我們的本質。編程吸引我們的地方在於,你能夠非常迅速地構建事物。然而,對於那些描述起來相對簡單的事情,編程卻需要編輯數百萬行晦澀難懂的正式編程語言,需要投入大量大量的工作,才能真正讓那些描述起來簡單的東西呈現在屏幕上。
我們認爲,在未來五到十年內,將有可能發明一種新的軟件構建方式,這種方式將更高級、更具生產力。這仍然歸結於定義你希望軟件如何運行以及你希望軟件呈現什麼樣子。所以我們使用 Cursor 的目標就是實現這一點。而我們達到該目標的方法是,在任何給定時間點,始終成爲結合人工智能進行編碼的最佳方式,然後演進這一過程,使其脫離傳統編程,演變爲截然不同的東西。
理想與現實:我們離未來還有多遠?
陳嘉興: 所以有些人會說,這正是我們今天所擁有的。你只需描述你想要什麼,它就實現了。對此您有何看法?我們已經達到那個階段了嗎?那麼,要達到您真正想去的地方,需要哪些步驟呢?
邁克爾·特魯爾: 我們正在看到事情真正開始變化的最初跡象。我認爲你們與 YC 可能正處於其前沿,因爲我認爲在較小的代碼庫中,由較少的人員組共同開發一個軟件項目時,在那裡您對變化的感受最爲強烈。在這種情況下,我們已經看到人們超越代碼層面,提升到更高層次的抽象,並基本上要求智能體和人工智能爲他們完成所有更改。
我認爲在專業領域,我們仍有很長的路要走。我認爲那種不求甚解地編程,或者在不真正查看和理解代碼的情況下編程的整個想法,實際上行不通。這會產生許多n階效應。畢竟,如果你正在處理數百萬行代碼,並且有數十甚至數百人持續多年地從事某項工作,那麼目前你真的無法僅僅避免思考代碼本身。
我們的主要重點是幫助專業程序員,幫助那些以開發軟件爲生的人。在這些環境中,人們越來越多地使用人工智能來編寫代碼。平均而言,我們看到人們使用AI編寫了Cursor中生成的代碼行數的40%到50%。但這仍然是一個閱讀AI生成的所有內容的過程。因此,作爲一款產品,我們需要跨越的一個重要鴻溝將是達到這樣一個階段:我們不再僅僅是一款幫助您查看、閱讀、編寫和理解代碼的生產力工具,並且代碼產物(或成果)的性質也隨之改變。我認爲對於專業開發人員來說,在這方面仍有很長的路要走。
陳嘉興: 在你看來,你是否認爲它有不同的層級?當然,初創公司通常是從零行代碼開始的。所以那非常簡單。目前你是否在追蹤某個時間點,哦,那就是說,隨性編碼停止奏效的時候。而那時,事情就變得真實起來。
邁克爾·特魯爾: 如果你希望代碼能長期存在,我們絕對不推薦那種隨性編碼的方式。我認爲,當你是一家兩三人或四人規模的初創公司,並且你還在摸索、試圖弄清楚自己在做什麼時,軟件開發的一個特點是代碼通常只存在數週。
現在,我們正處於這樣一個階段,人工智能在某種程度上充當着你的助手,對嗎?所以,人們使用人工智能進行編碼的主要方式是:他們要麼將任務委派給人工智能,並說,幫我做這件事,幫我回答這個問題。或者他們有一個人工智能在旁協助,時不時地接管鍵盤。這就是那種輔助形式。我認爲,在接下來的六個月到一年內,關鍵在於使這兩種形式的效用提升一個數量級。旁觀別人的工作時,有時編碼過程是極其可預測的,你能預知他們接下來10、15、20分鐘的工作。因此,這種輔助形式可以發展得非常深入。而將任務委託給另一個人的代理模式也可以發展得很遠。
我認爲,一旦這些模式開始成熟,並且在25%到30%的專業開發工作中,你可以完全依賴它們端到端地完成任務,而無需太多關注細節。屆時,還需要解決所有其他問題,以使這些模式在現實世界中真正發揮作用。
技術瓶頸與未來交互界面
邁克爾·特魯爾: 一種看待大型語言模型(LLM)的方式是,你像與人類助手一樣與它們進行交互。另一種看待大型語言模型(LLM)的方式是,它們是編譯器或解釋器技術的一種進步。如果我們能成爲一個工具,幫助人們將腦海中的想法呈現在屏幕上,並讓他們能夠掌控最精微的細節,這總是非常有幫助的,對嗎?這是我們面臨的產品挑戰之一,即你總應該能夠將某物移動幾像素。你總應該能夠編輯關於邏輯的某個非常具體的方面。
我認爲一個始終有用的用戶界面,是能夠將軟件的邏輯書面記錄下來。並且你可以指向邏輯的各個部分,並實際編輯它們。但如果我們能達到一個不必過多關注代碼的境地,那麼軟件邏輯的那個書面記錄版本就必須變得更高級。因此,是的,我們很興奮地思考,在代理程序運行起來,在標籤頁形式變得非常成熟之後,人工智能是否會實際改變編寫和查看編程語言的含義?
陳嘉興: 這會是一種上下文窗口的體現嗎?你知道,這似乎有點道理,一旦你超過大約一百萬到兩百萬個token,我感覺,我們僅僅在過去一百天內才獲得了可用的兩百萬token長度。當你的代碼庫達到一定規模時,這自然會成爲一個節點,屆時你必須使用檢索增強生成,但它有不完整的上下文,然後就無法做到人類程序員能做到的事情,是嗎?
邁克爾·特魯爾: 是的,我認爲智能體達到人類水平存在諸多瓶頸。我認爲其中之一是上下文窗口方面的問題,這是一個實實在在的挑戰,例如,如果你有1000萬行代碼,那可能就是1億個token。要有一個模型能夠真正攝入這些信息,使其具有成本效益,並且不僅僅是模型能夠物理地將其吸納到其權重中,還要能夠有效地關注該上下文窗口,這很棘手。我認爲這是該領域需要努力解決的問題。
而且這不僅僅是基於代碼的問題。這也是一個持續學習的問題,比如瞭解組織的背景,過去嘗試過的事情,以及你的同事是誰。而模型真正持續學習某個問題的難題,我認爲,該領域仍然沒有一個很好的解決方案。人們一直懷疑,或者說很多人認爲,只要把上下文窗口做成無限大,問題就解決了。我認爲,訓練這些模型的機構缺乏真正優秀的長上下文數據。所以我認爲那會很棘手。但持續學習和長上下文能力無疑是成爲超人類的瓶頸。
這有些相關,但能夠跨越非常長的時間範圍執行任務並持續取得進展,也是一個關鍵點。在互聯網上流傳着一張令人驚歎的圖表,展示了過去一兩年中,AI在任務上能保持持續進展的最長時間長度的進展。它已經從,你知道的,幾秒鐘上升到——我不太清楚這些數字具體是如何得出的,但我認爲有人聲稱,一些最新的模型可以達到大約一小時。
此外,還有不同模態的問題。所以,要成爲一名軟件工程師,你確實需要運行代碼,然後調試輸出結果。如果沒有,你簡直會遠超人類。那將是不可思議的。因此,計算機操作對於代碼的未來將非常重要。能夠運行代碼,能夠查看DataDog日誌,並與人類使用的那些工具進行交互。我們將不得不面對許多已知挑戰。接着,在使編程智能體超越人類的任務中,我們還將不得不面對許多未知挑戰。
接着,我想指出一點,回顧上一個回答,即使你有一個可以在編程方面達到人類水平,或者比人類編程更快更好,甚至超越人類,相當於整個工程部門技能水平的對話對象。我認爲,僅僅通過一個文本框來請求修改軟件的用戶界面是不夠精確的。因此,即便到了極致,如果你關心人類能否控制屏幕上顯示的內容,你將需要一種不同的交互方式。因此,一種潛在的用戶界面是編程語言向更高級別的演進。另一種可能是直接操作用戶界面,對嗎?能夠指向屏幕上的內容,並說:“哦,改變這個”,或者你自己實際微調這些值。
陳嘉興: 我的意思是,這看起來像是一系列剛剛顯露頭角、蓄勢待發的事物,對嗎?例如,這些模型似乎對美學沒有真正清晰的感知。那麼,關於或許人類關卡設計師需要真正地……他們需要能夠看到這一點。
邁克爾·特魯爾: 看到他們在美學方面有所進步,這很有趣。我認爲這實際上是一個有趣的具體例子,說明了我們如何巧妙規避這些持續學習問題。但我們的理解是,教導這些模型在美學等方面做得更好的方式,與教導人類的方式不同。它是通過,你知道的,基本上收集大量數據,並對它們進行強化學習。這就是你教導它完成那項任務的方式。而且這項任務足夠多的人關注,以至於你可以承擔所有這些工作的成本。而且你可以去訓練它,並將其融入到基礎模型中。但這算是解決持續學習問題的一種變通之法。
工程師的未來:不可替代的“品味”
陳嘉興: 那麼,鑑於每個人都在努力構建的這種未來,而你無疑是走在前沿的領導者,你認爲未來軟件工程師的哪些部分將是不可替代的,或者說是必備要素?
邁克爾·特魯爾: 我們認爲,品味將是不可替代的。那麼,僅僅是定義你實際想構建什麼?人們通常在考慮軟件的視覺方面時會想到這一點。我認爲,在軟件的非視覺方面也存在品味要素,例如邏輯如何運作。而現在,編程行爲某種程度上將你弄清楚到底希望事物如何運作,以及你正在編寫的邏輯真正在定義什麼產品,這些都捆綁在了一起。以及它如何映射到物理計算機上的實現細節方面的高層次品味。
但現在,很多編程就像你正在進行的人工編譯,你大致知道你想要什麼。你可以告訴另一個人,但你真的必須爲計算機詳細說明,因爲你用來向計算機描述事物的語言,對於常規編程來說,只是你知道的循環、條件語句、變量和方法,你真的必須逐字逐句地解釋。因此,我認爲越來越多像人工編譯這樣的步驟將會消失,計算機將能夠填補空白,完善細節。但既然我們,你知道的,我們的工具正在幫助你實現事物,幫助你構建事物,那種對於什麼是真正有用、對於你想要構建什麼的品味,我認爲永遠不會消失。
陳嘉興: 這說得通。有這樣一句話,優秀的人會幫助你達到這個標準,但真正偉大、真正精通的人,他們能達到一個你甚至無法看到的高度。是的。所以,那需要品味。是的。你曾說過,人們需要成爲某種邏輯設計師。那麼,就意圖驅動編程而言,那意味着什麼呢?
邁克爾·特魯爾: 隨着這項技術越來越成熟,隨着我們越來越接近一個編程能夠自動化並能以更好的方式構建軟件的世界。我認爲這會帶來一系列影響。我認爲其中之一就是,專業的開發者將會變得效率大大提高。千人規模的軟件項目進展得如此緩慢,簡直令人難以置信。是的。百人規模的軟件項目以及真正的專業軟件項目進展得也很慢。其中很大一部分原因在於現有邏輯的沉重負擔,它會讓你束手無策。當你在一個新的代碼庫中時,你可以從零開始。你可以非常迅速地完成工作。當你改變某件事物時,不會有一大堆其他東西隨之崩潰,需要你去修復。
我認爲其中一個影響將是,下一個分佈式訓練框架、下一個數據庫或下一個可視化設計工具將能更快地構建出來。下一個AI模型也是如此,如果你和那些實驗室交流,會發現他們主要受限於工程能力。我認爲所有這些都將大幅改善。
我認爲,一個二階效應是,將會有更多利基軟件存在。我最早的一份工作實際上是在一家生物科技公司工作。這是一家由溼實驗室科學家組成的團隊。他們正在研發治療疾病的藥物。我是他們僱傭的第一位軟件工程師。他們當時正在生成大量的化學物質,然後將其用於這些生物實驗。然後他們需要一個讀出結果,以便弄清楚哪些化學物質值得進一步研究。爲此,他們需要大量的內部軟件開發。令人驚訝的是,市面上現有的工具簡直太差勁了。然後,想到這家公司,儘管軟件並非其核心競爭力,卻不得不付出巨大努力去僱傭一支真正的軟件工程團隊,並對其進行培訓,讓他們從事內部產品開發,這簡直是不可思議。對於那樣的公司而言,將會有更多可用的選項。數字空間的物理特性已經非常出色,但我認爲未來這隻會得到大幅提升。你期望在計算機上實現的事情,屆時就能實現。
Cursor的起源:從CAD到代碼
陳嘉興: 換個話題,我想聽聽關於Cursor早期的情況。你在麻省理工學院遇到了你的聯合創始人——Swale、Arvid和Aman。這家公司始於2022年。是什麼讓你們走到一起?你們又是什麼時候意識到這是一個能夠共同成就一番雄心勃勃事業的團隊?
邁克爾·特魯爾: 我認爲我們當時非常年輕天真,這種天真在當時可能是沒有根據的。所以從一開始,我們就頗具雄心。Cursor實際上源於一次雄心勃勃的構思實踐。對於我們四人而言,我們都很早就接觸了編程。而我們最早的一些工程項目實際上都與人工智能有關。我們中的一人致力於提高機器人強化學習的數據效率。也就是讓機器人能夠非常快速地學習新任務。那是我們早期的人工智能項目之一。我們中的另一人致力於構建一個實際上是谷歌競爭對手的產品,通過使用神經網絡,試圖加速構建一個卓越的網絡搜索引擎。其他人則從事人工智能領域的學術研究。
但在2021年,有兩個時刻讓我們對創建一家專注於人工智能的公司感到非常興奮。其中之一是使用了首批真正實用的人工智能產品,其中人工智能是真正的核心。而 GitHub Copilot 坦率地說,是那個讓我們發自內心地感受到現在利用人工智能創造真正有用的東西成爲可能的時刻。而且我們不應該在實驗室裡,比如在學術實驗室裡從事這些工作。相反,是時候讓這些技術走向現實世界了。另一件讓我們非常興奮的事情是,OpenAI 和其他地方發佈的研究表明,存在着非常可預測的自然法則,它們顯示如果擴大數據規模並增加投入到這些模型中的算力,它們就會變得越來越好。因此,這意味着即使我們用盡了改進人工智能的想法,仍然有幾個數量級的提升空間可以繼續探索。
從一開始,我們就想選擇一個知識工作領域,然後研究隨着人工智能的日益成熟,這種知識工作會演變成什麼樣子。我們對這樣一種公司形態非常感興趣:即爲特定知識工作領域開發產品。因爲這能讓你做幾件事。其一,隨着底層技術日益成熟,你可以演變完成那項工作的形態。其二則是,即使在那時,也很清楚地看到,你可能需要的不僅僅是擴大語言模型(比如達到 GPDN)的規模。而持續關注底層機器學習進展的一種方式是,獲取產品數據,瞭解人們喜歡哪些建議?他們不喜歡哪些?還有哪些人工智能仍無法真正觸及的人類工作的難點?而如果你是知識工作發生的核心界面,你就能獲得這些數據。
因此,最初我們着手將此應用於我們實際上不太瞭解的一個知識工作領域,即機械工程。我們曾一度致力於開發一款計算機輔助設計(CAD)的輔助工具。因此,我們當時正在訓練三維自動完成模型。也就是幫助那些在使用SolidWorks或Fusion 360等軟件進行零件三維建模的人,並嘗試預測他們將要對幾何形狀進行的下一次更改。這是一個有趣的問題。也是學術界一直在研究的問題。實際上DeepMind也曾涉足過這個領域。
陳嘉興: 而這些本身並非大型語言模型。
邁克爾·特魯爾: 你可以完全以三維形式來做。或者你可以做的是,我們曾致力於的一個方向是將其轉化爲一個語言問題,即你將某人在CAD系統中執行的步驟,某種程度上轉化爲方法調用。所以,如果他們正在繪製一個圓,你就把它作爲一個方法調用。它就像一個方法調用列表。它算不上真正的編程,但看起來有點像。問題是,如果你打算完全基於文本來做,你要求模型去做一些非常棘手的事情,它不僅要預測用戶下一步會做什麼,還要在其內部認知中模擬幾何結構。因爲CAD內核,也就是這些CAD應用程序底層的軟件,它們相當複雜。而僅僅通過觀察用戶執行的動作序列,很難憑空想象出最終成果是什麼樣子。這相當棘手。
但我們爲此努力了一段時間。那裡有大量的數據工作要做,大量的CAD數據抓取工作,因爲公共互聯網上存在CAD數據。我們需要獲取這些數據,以使模型越來越好。然後我們擱置了它。這有幾個原因。其一,我們對機械工程的興趣不如對編程的興趣大。我們都是程序員。另一個原因是,我認爲那時的科學技術尚未爲3D做好準備。預訓練模型在這方面表現不佳。數據量不大。互聯網上的CAD模型數據量比代碼少好幾個數量級。因此,很難構建一個有用的模型。或者說,那時候針對那個領域很難構建一個有用的模型。
陳嘉興: 你們最終是否去和那些CAD用戶,或者... ...機械師以及諸如此類的人交流了呢?
邁克爾·特魯爾: 是的,我們做了。我們進行了大量的用戶訪談。我認爲我們本可以做得更好。我認爲,這也許再次是年輕時的天真,我們日復一日、周復一週地工作,按小時計算任務。回顧我們在這上面花費的時間,我想,如果當初直接去一家僱用機械工程師的公司工作三週,效果會更好。
陳嘉興: 就當作是臥底。
邁克爾·特魯爾: 更深入地瞭解機械工程的整體面貌。
陳嘉興: 簡單地找一份繪圖員的工作。是的,是的。並且親眼看看人們究竟在做什麼。我認爲那會非常有價值。
邁克爾·特魯爾: 用這個替代數百次用戶訪談中的一部分,效果會很棒。
陳嘉興: 我想與此同時,你們也開始訓練自己的模型來完成這項工作,並且使用了強化學習(RL)。那也非常有用。並且也學習瞭如何部署大型集羣來實際訓練這些模型。
邁克爾·特魯爾: 是的。所以在那段徒勞嘗試的時期,我們當時並不知道。但是的,我們在那裡做的一些事情最終對我們很有用。那時主要在做行爲克隆,較少涉及強化學習。但當時是在觀察人類行爲的良好範例,然後訓練人工智能去做那些事情。但是的,當時訓練參數量達到數百億級別的大型語言模型,並非很多人都在做的事情。儘管我們當時研發的產品和模型的最終成果並沒有那麼有用。但它是一次極好的規模化模型訓練和規模化推理的演練。當時,坦率地說,即使是現在,也沒有那麼多人訓練100億以上參數規模的大型語言模型或機器學習模型。因此,基礎設施的狀態非常非常早期。我們當時在做的事情包括分叉(forking)Megatron LM 或 Microsoft DeepSpeed,然後剝離其內部核心,再將其部署用於訓練。
即使在推理方面,在那段時期,我們也有幾項大規模運行的工作。如今在 Cursor,我們每天在我們自己的推理系統上進行超過5億次模型調用。當時進行推理和訓練的一些經驗,對於 Cursor 的開發和使用體驗無疑是極其有益的。
關鍵轉折:順應曲線,迴歸初心
陳嘉興: 所以,有一件事,我是說,首先是極其勇敢,但也是極其有遠見的,那就是暫停片刻並表示,實際上我們對CAD瞭解不足,我們需要做些別的事情。它是從訓練CAD模型,並認識到擴展定律正在發揮作用,以及這是一個我們可以涉足的領域,然後直接發展而來的嗎?然後你意識到,實際上,我們需要做些別的事情。那麼,究竟是什麼促使它實際轉變爲今天的樣子?
邁克爾·特魯爾: 這並非一條直線。我的意思是,我們自己作爲程序員,受到Copilot等產品的啓發,以及早期Codex論文等文獻的啓發。我記得當時,我們做的一件事,就是爲了向投資者證明他們應該投資我們這個瘋狂的CAD想法,我們粗略計算了第一個編碼模型Codex的訓練成本。據我所知,根據我們的計算,它的成本只有大約9萬或10萬美元。這在當時真的讓投資者感到驚訝,並且在某種程度上幫助我們獲得了足夠的資金來追求CAD的想法,因爲你必須立即開始訓練。
所以我們一直都瞭解編碼。我們一直都對此感到興奮。我們一直都對人工智能將如何改變編碼感到興奮。對於進入並從事那個領域,我們曾有點顧慮,因爲已經有很多人在做了。而且我們認爲Copilot非常棒。而且當時還有數十家其他公司也在從事這項工作。當我們決定擱置那個有點脫離我們核心理念的CAD項目時,這主要是因爲科學上進展不順,而且我們對那個領域本身也缺乏熱情。吸引我們重新投入編程的,是我們的個人興趣。
而當時給我們信心繼續下去的原因有二:其一,是看到他人在大約九個月時間裡所取得的進展,儘管感覺那進展比本可以達到的速度慢了一些。其二,是坐下來思考,如果我們真正堅守自己的信念,那麼在五年內,所有的編碼都將通過這些模型進行。編程行爲將徹底改變。爲了實現這一目標,無論是產品層面還是模型層面,都需要實現這些飛躍。而且其天花板是如此之高。而且,該領域現有的參與者似乎並沒有瞄準一種完全不同類型的編程。他們似乎沒有那種雄心,也似乎沒有真正爲此做好執行的準備。那第一次經歷教會了我們,創辦一家公司是艱難的。所以你大可以去從事你真正熱衷的事情。於是,我們便着手研究編程的未來。
陳嘉興: 這聽起來格外有先見之明,因爲大約一年前,薩姆·奧爾特曼曾坐在這把椅子上,談到如果你與模型變得更智能的趨勢作對,那是不明智的。你應該始終相信模型會變得智能得多。12、18、24個月後,這一點被證明越來越真實。聽起來,你甚至在那番話被說出整整12個月之前,就已經採取了這種立場。
邁克爾·特魯爾: 是的,我們當時有個說法,叫做“順應發展曲線”。你應該始終順應這條發展曲線,並預判其走向。我的意思是,這有點回溯到規模法則,即這些事物只會變得越來越好。
陳嘉興: 彼得·蒂爾的經典論斷是:你相信什麼,而別人都不相信?你相信這一點,而且你是如此正確,正是這一點讓你能夠真正走向趨勢的未來發展方向。
邁克爾·特魯爾: 是的,我認爲這是有幫助的方面之一。而現在,顯然它變得更加盛行。但在那時,你知道,2022年是一個瘋狂而關鍵的年份,當你從年初開始時。真的沒有人談論AI。我的意思是,GPT-3在前一年已經發布了。Copilot確實出現了。Copilot在2021年是測試版,然後可能在2022年正式發佈。然後它開始流行起來。而且,你知道,我們仍然記得所有InstructGPT的推出,它讓GPT-3變得更好了一些。這是對指令進行的微調。接着是夏季的達爾·伊。我記得那是一個令人震撼的時刻,它說服了許多不關注這個領域的人,讓他們更多地關注它。但隨後出現了龐姆(POM)和穩定擴散。接着你開始接觸到人類反饋強化學習(RLHF)。你開始接觸到3.5。並且這些模型在訓練成本沒有大幅增加的情況下變得越來越好,這是一個有趣的發展。但有傳聞稱,從GPT-3到聊天GPT,訓練成本僅增加了約1%,而GPT-3已經存在一段時間,雖然沒有給一些人留下深刻印象,但它肯定不像聊天GPT那樣具有突破性意義。這得益於對指令的微調、人類反饋強化學習以及其他一些細節。
陳嘉興: 你還記得嗎,是否有過具體的特性或產品選擇,是基於你預見到模型將不僅僅是稍微變得更聰明,而是顯著變得更聰明而做出的?那是否改變了具體的產品或路線圖,最終某種程度上導致了你們的成功?因爲你提到,我的意思是,肯定還有十幾家同樣實力雄厚的公司也在這個領域。
邁克爾·特魯爾: 所以我們早期做的一個非普遍共識的產品決策,源於對一個更具顛覆性未來的興奮,那就是不構建擴展程序,而是構建一個編輯器。那在當時對人們來說並不顯而易見。是的,這源於一種想法,即所有的編程都將通過這些模型進行。它在未來會看起來截然不同。你將需要控制用戶界面。
它也來自於我們所知的一些有趣的軼事。所以我們對構建第一個版本的 GitHub Copilot 的內部運作細節略知一二。整個構建 GitHub Copilot 的故事,據我所知(我沒有第一手資料,所以某些細節可能不準確),相當有趣,它始於一個尋找問題的解決方案的階段,即僅僅是對將 GPT-3 應用並使其對程序員有用感興趣。我認爲這來自於領導層。它來自當時 GitHub 的首席執行官。他只是說,我們需要這樣做。他就像是派遣了一個完整的團隊去弄清楚……當時是馬特·弗裡德曼嗎?是的,據我所知,這出自馬特。
我想他花了近一年的時間在“沙漠”中摸索,嘗試了各種不同的產品理念。當然,他們有……這些人對人工智能的未來充滿熱情。所以他們立刻想到,我們能否在時機未到之前,就稍微自動化一下拉取請求的意圖?他們爲此努力了一陣,然後斷定那是不可能的。他們嘗試了所有這些稀奇古怪的產品構想,直到他們最終只做了自動補全這個簡單的功能。但即便在他們讓自動補全功能正常工作後,他們仍然需要在編輯器層面進行修改。他們無法完全以擴展的形式實現。他們不得不去修改VS Code主代碼庫中的內容,並暴露不同的編輯器API,才能僅僅顯示出那種幽靈文本。然後,根據我的理解,有些事情在組織上其實是相當難以完成的。如果要爲像幽靈文本自動補全這樣簡單的功能修改編輯器,我們就知道將來會有大量類似的工作。
所以那並非顯而易見。我們爲此招致了很多批評。我們最初實際上是從零開始構建自己的編輯器,顯然使用了大量開源技術,但並沒有像瀏覽器基於Chromium那樣,以VS Code爲基礎。這有點更像是從頭開始構建瀏覽器所有的內部渲染。我們就用它發佈了,然後我們切換到基於VS Code。但編輯器這件事並非顯而易見。
從產品到公司:增長、指標與團隊建設
陳嘉興: 所以,Cursor 問世了。你們做出了一系列結果證明是正確的決策。你們什麼時候知道它會成功的?
邁克爾·特魯爾: 這花了一些時間。如果你還記得,最初有一年左右的時間,大概是一年的“荒野期”,我們一直在研發一個 Cursor 的前身,並且主要是在機械工程方面。之後是 Cursor 的一個相當短的初始開發期,然後我們才向公衆發佈了第一個版本。我認爲,從開始編寫代碼到首次公開測試版發佈,只用了三個月。但在那之後,我們又經歷了在非常小的規模上公開迭代的一年,期間我們沒有找到那種爆炸性成功的模式。儘管有所增長,但用戶數量依然很少。
當時,爲了精調產品並把所有細節都處理好,大概花了一年時間。直到Cursor推出後的最初九個月到一年時間,團隊持續致力於底層產品的開發和團隊的組建,此外,不僅是產品層面,當Cursor開始獲得並利用其背後定製模型的第一批版本來提供底層動力時,事情纔開始變得水到渠成。然後增長才開始加速。之後,是的,從那時起,我們就有點像是抓住了猛虎的尾巴。如果我們要取得成功,未來還有很多事情需要我們持續推進。我認爲我們和許多其他在類似領域的公司面臨的挑戰之一,就是我們需要建設公司的速度確實非常快。而我認爲,關於“人員編制增長不應超過50%”或“逐年”之類的經驗法則。
陳嘉興: 鐵律。
邁克爾·特魯爾: 是啊,我想,它們需要被打破。
陳嘉興: 有意思。當時是否有一些北極星指標,或者你和你的聯合創始人正在監測的事項,以判斷這是否奏效?是周環比留存率,還是打開率?或者這如何影響了你們在特定一週的工作內容?
邁克爾·特魯爾: 我們關注了所有常規指標,比如留存率。對我們來說,我們主要關注的活躍度指標,或者說我們主要關注的頂線指標,是營收。我們關注的付費高階用戶,衡量標準是:你在一週七天中有四到五天在使用這款AI嗎?而這個數字正是我們努力提升的目標。爲什麼要收費?嗯,我認爲我們是一個爲專業人士服務的工具。而且我認爲提供這個工具,它是有真實成本的。所以我們很關注您升級到付費層。那纔是事物可持續發展的地方。付費的重度用戶,那纔是我們關注的,你知道,而不是日活躍用戶、月活躍用戶或類似的東西。而是,你是否每天都在工作中用到它?那就是我們試圖提升的。
陳嘉興: 那麼一旦那成爲衡量指標,我想,你們是否從那倒推呢?就像是,嗯,我們知道我們想要發展的目標人羣。那麼他們想要什麼?或者是什麼會阻止人們成爲那樣?
邁克爾·特魯爾: 我認爲,在很多領域,爲自己而構建是行不通的。對我們而言,它確實可行。我認爲這實際上是澄清了問題,因爲構建AI產品時,一個極具誘惑力的誤區就是過度優化演示效果。我們非常擔心過度優化演示效果,因爲對於AI來說,很容易就能拿幾個例子拼湊出一個視頻,讓你看起來好像擁有了一款革命性產品。然後我認爲,從能呈現出出色演示效果的版本,到真正有用的AI產品之間,還有很長一段路,需要大量工作,這意味着要精細調整速度、可靠性、智能和產品體驗等方面。
對我們來說,我們真正付諸行動的主要一點就是重新加載編輯器。我們早期的產品開發過程非常具有實驗性。它非常專注於我們所理解的蘋果模式,即非常注重內部測試和可用的演示,比如我們可以在內部編輯器中立即開始使用的東西。然後我們會查看這些指標,以確保我們周復一週、月復一月地朝着正確的方向發展。是的。
陳嘉興: 所以你之前說過,我的意思是,有時候你必須打破招聘方面的這些鐵律。你是何時決定打破它的?我的意思是,你知道,是不是直到達到某個營收目標之前,都只有聯合創始人和少數幾個人?你是如何考慮油門的?你是輕踩油門了嗎?然後,一旦情況明朗,比如你達到了目標,我們就會把油門踩到底。
邁克爾·特魯爾: 所以很長一段時間裡都只有聯合創始人。然後是聯合創始人以及少數幾個人,直到我們達到事情真正步入正軌並蓬勃發展的階段。
陳嘉興: 首批僱員都有誰?我的意思是,我猜是更多工程師,但你知道的……
邁克爾·特魯爾: 所以我們爲首批員工的招聘煞費苦心。我認爲,如果你想以年爲單位快速發展,那麼以六個月爲單位放慢腳步實際上會非常有幫助。因爲如果你真正精準地招募到公司最初的10名員工,他們將在未來助你提速。因爲當(你知道的)第N位考慮與你合作的人來到公司,並與團隊相處時,他們會直接被這種人才密度所震驚,然後會非常興奮地想在那裡工作。那麼他們能幫助你未來更快發展的另一個原因在於,如果有人加入後發現不太合適,這些人會像免疫系統一樣對此進行抵禦,對嗎?他們會是某種程度上維持高標準的守護者。
所以我們在初期招聘速度非常、非常、非常慢。我們之所以能夠這樣做,部分原因還在於我們擁有一個如此龐大的創始團隊,並且所有聯合創始人都是技術出身。不過,我們招募到的人才都非常出色,他們如今確實是公司的核心。還有那些跨學科深耕的人,因爲我們這家公司需要介於基礎模型實驗室和普通軟件公司之間。模型和產品必須在一個體系下協同運作。因此,我們擁有許多優秀的人才,他們既有產品思維和商業頭腦,又曾大規模訓練過模型。
陳嘉興: 所以,通才型的多面手在公司最初的10人階段確實非常重要。
邁克爾·特魯爾: 是的。以及快速構建產品。是的。並快速交付生產代碼。
陳嘉興: 如今,我是說,每個人都在努力弄清楚如何應對這種情況,但僅僅因爲AI工具過於強大,有時甚至更難判斷如何評估優秀的工程師?隨着你的產品變得越來越普及,這一點對你來說是否隨着時間推移而改變了?你們是否會挑選那些非常擅長使用人工智能工具的人?抑或是,你們仍然堅持傳統,認爲任何人都可以學會如何使用人工智能工具?
邁克爾·特魯爾: 因此在面試時,對於我們的首次技術考覈,我們實際上仍然不允許面試者使用人工智能,除了自動補全功能。沒有人工智能的編程仍然是一個衡量技能、智力和作爲程序員你希望團隊成員始終具備的素質的絕佳限時測試。但另一個原因是,我們已經僱傭了許多非常優秀的程序員,他們實際上並沒有使用人工智能工具的經驗。我們也不希望因爲這些工具非常有用就讓他們處於不公平的劣勢。所以我們寧願僱傭這些人,然後在工作中教他們使用這些工具,並且從他們第一次使用這些工具的初學者思維中挖掘產品洞察。
陳嘉興: Cursor 現在價值90億美元。隨着團隊規模的擴大,你們如何保持那種黑客精神?你現在還寫代碼嗎?
邁克爾·特魯爾: 我寫。是的。這是我們經常思考的問題,因爲我認爲未來的 Cursor 必須與今天的 Cursor 大相徑庭。
首先,我認爲可以通過招聘合適的人才來實現這一點。所以我們招聘流程的最後一步是爲期兩天的現場考察,你來和我們一起完成一個項目。而這發生在初步的技術篩選之後。你在辦公室裡,就像團隊成員一樣,和我們一起用餐,一起完成某項工作。然後你在最後進行演示,之後我們向你提問。這旨在考察你對該問題領域的精力、興奮度和激情。如果你可能只是將其視爲一份工作,並且同時向許多科技公司投遞簡歷,那麼你通常不太可能非常樂意去做這件事。所以我認爲一個重要的方法,就是通過招聘流程引進有熱情的人才。
有些大型項目需要人與人之間大量的協調,你需要自上而下的統一步調。我認爲我們始終希望成爲一個也大力推行自下而上實驗的地方。因此,我們確實努力鼓勵這一點,既鼓勵員工利用業餘時間進行嘗試,也明確地組建工程師團隊,將他們從公司其他部門中獨立出來,並給予他們完全的自由,讓他們可以隨心所欲地進行實驗。
護城河與未來展望
陳嘉興: 因此,我認爲所有初創企業乃至所有企業現在都在努力弄清楚的一件事是,面對世界上一些最令人印象深刻和難以置信的模型,真正持久且可用的護城河是什麼?你對此有何看法?
邁克爾·特魯爾: 嗯,我認爲我們所處的市場以及其他公司所處的市場,與你過去見過的那些並非企業級軟件的市場非常相似。因此,我認爲許多企業級軟件市場的特點是,其產品所能提供的核心價值存在較低的天花板。而且存在大量的鎖定效應。
我們所處的市場有點像90年代末的搜索市場,產品的上限非常高。搜索功能在很長很長一段時間內都可能得到大幅改進。而對我們來說,最終目標是用遠勝於編碼的方式來取代編碼,並實現編碼自動化。我認爲在這方面,我們還有很長很長的路要走。搜索的一個特點,我認爲也是我們市場的一個特點是,分發對於產品的改進非常有幫助。因此,如果你的產品有大量用戶,你就能擁有一項規模化業務,並能瞭解產品在哪些方面出了問題,在哪些方面表現良好。所以在搜索領域,這意味着觀察人們點擊了什麼?他們從什麼結果跳出?什麼是好的搜索結果?什麼是差的搜索結果?這繼而爲研發提供支持,並幫助他們打造更好的搜索引擎。
對我們而言,就是要觀察人們在哪裡接受了某些事物?他們在哪裡拒絕了某些事物?在那些他們先是接受了某些事物但之後又進行了修正的地方,究竟是怎麼回事?我們本可以做得更好嗎?我認爲這將是未來讓產品和底層模型變得更好一個非常非常重要的驅動力。
我認爲另一個可以汲取靈感的市場是21世紀初的消費電子產品領域。當時關鍵在於成功抓住了iPod的契機,接着又抓住了iPhone的契機。而且,我認爲ChatGPT時刻就像我們這個時代的iPod或iPhone時刻,如果你比其他人更快地推動前沿,你就能獲得巨大的收益。我認爲在我們的領域中還存在着幾個這樣的時刻。這樣做很難,但我們確實專注於努力成爲那些最快衝向目標的人。
陳嘉興: 現在是2025年。我覺得我們實際上甚至還處在這個智能時代的開端階段。這真是一場革命。你知道,你個人現在最興奮的是什麼?
邁克爾·特魯爾: 我認爲這將是一個你的構建能力得到極大提升的十年。無論是那些以此爲生的人,還是那些從事這方面工作的人。但我認爲它也將對更多的人開放。
陳嘉興: 生逢其時。感謝你今天與我同行。
邁克爾·特魯爾: 謝謝。感謝您的邀請。