知名科技分析師Ben Thompson:英偉達仍是AI變革最大贏家
(原標題:萬字深度:英偉達仍是AI變革最大贏家|知名科技分析師Ben Thompson)
文章來源:數字開物
2月25日,美國知名科技分析師Ben Thompson在最新發表的芯片深度分析文章中指出,AI行業正處於“黃金時代”,但同時芯片供應鏈面臨着挑戰。
Thompson分析了當前頂級AI模型間的競爭格局,指出Anthropic最近發佈的Claude Sonnet 3.7計算規模上仍屬於GPT-4級別。相比之下,xAI的Grok 3更像是一次計算能力的階梯式提升,至於OpenAI,他指出OpenAI已成爲“一家意外的消費科技公司”,這一轉變可能是近年內部動盪的根本原因。
文章還分析了AMD面臨的軟件挑戰、華爲Ascend芯片的進展,以及包括AWS(Trainium)、微軟(Maia)、谷歌(TPU)和Meta(MTIA)在內的超大規模科技公司自研芯片的情況。Thompson表示,英偉達仍然是AI芯片領域的最大贏家。
文章最後,Thompson提出了幾項具體建議,包括結束在美國建設成熟工藝晶圓廠、加強英特爾代工業務、補貼英偉達在英特爾代工廠生產芯片等。
以下是文章,經翻譯編輯
昨天,Anthropic發佈了ClaudeSonnet3.7。隨後,DylanPatel開玩笑說,Anthropic似乎很避諱數字“4”,因爲“4”在中文裡諧音“死亡”,這成了當日最佳笑話。
言歸正傳。EthanMollick在一篇文章中提出,Anthropic沒有提升主版本號,是因爲就算力而言,Sonnet3.7仍屬於GPT-4同級別的模型。
這篇文章發佈後,我聯繫了Anthropic,他們告訴我,Sonnet3.7並非計算量達到10^26FLOPs的模型,訓練成本也未達到數千萬美元,不過他們未來的模型規模會更大。我已經用這些信息更新了文章。唯一值得注意的修改是,Claude3現在被稱爲高級模型,而非Gen3模型。
我欣賞Mollick的工作,但不同意他那種中立的命名方式:誰先達到新的模型世代水平,誰就應該獲得該代際的命名權。換句話說,如果第二代模型達到了GPT-4的水平,那麼第三代模型就應該達到Grok3的水平。
此外,雖然Sonnet3.7是Sonnet3.5的迭代升級,在個性和編碼能力方面實現了令人欣喜的融合,這或許得益於Anthropic在後訓練階段採用的獨特方法。但Grok3給人的感覺截然不同,它更像是計算能力大幅提升的直接產物,僅輔以少量人工反饋強化學習(RLHF)。Grok3的回答更深入、更詳細(模型非常出色!),但經常過於冗長(人工反饋方面有所欠缺!);它能準確解答數學難題(模型很棒!),但解題步驟的解釋略顯晦澀(人工反饋方面有所欠缺!)。Grok3也更傾向於生成一些違禁內容,但深入挖掘會發現其內核與類似4chan的匿名社區探索。
Grok3,相比之前的所有模型,更像是提煉後的互聯網;它是我目前最喜歡的模型。
Grok3也在提醒我們速度的重要性,並由此揭示了基礎模型在當今人工智能驅動的推理世界中依然佔據重要地位的原因。Grok3的速度明顯優於競爭對手,從而帶來了更出色的用戶體驗;更普遍地說,對話比拼的是快速反應,而不是深度思考。我希望後者能勝任研究或需要智能體執行的任務;而前者則能在聊天機器人或語音交互界面中爲用戶帶來更優質的消費級體驗。
與此同時,ChatGPT依然保持着最佳的產品體驗——尤其是其Mac應用程序,體驗遠勝Claude——並且它以更加用戶友好的方式處理更多面向消費者的用例,例如數學家庭作業。DeepResearch在性能上明顯超越所有競爭對手(包括Grok的“DeepSearch”功能),而且在我看來,DeepResearch是目前最接近AGI的體驗。
然而,OpenAI最大的資產仍然是ChatGPT品牌及其建立的品牌認知度和用戶心智份額。首席運營官BradLightcap最近告訴CNBC,ChatGPT的周活躍用戶已突破4億,在不到3個月的時間內激增了33%。正如我在ChatGPT發佈四個月後所說,OpenAI是一家“意外走紅”的消費科技公司。消費科技公司不僅最難創建,也極有可能成爲最具價值的企業;與那些只提供API的研究機構相比,消費科技公司需要完全不同的公司文化和價值鏈。我推測,這正是推動OpenAI在過去兩年半時間裡發生劇變的根本原因:OpenAI的老員工最初並沒有計劃將公司打造成下一個谷歌搜索或Meta,而微軟也不甘心僅僅成爲一家提供零部件、卻無法掌控消費級關係的公司。
然而,事實上OpenAI的步伐還是慢了:無論“廣告支持”這個想法多麼令AI研究人員難以接受,該公司現在就應該推出這樣的版本。DeepSeek現象也揭示了一個重要事實:許多消費者並不瞭解OpenAI最好的模型有多好,因爲他們不是付費客戶。讓免費用戶能夠經濟高效地使用最好的模型,這完全符合OpenAI的競爭利益,而這意味着廣告。更重要的是,廣告模式是消費科技公司實現全球擴張的必經之路,這既可以最大限度地擴大潛在市場,還能持續提升用戶平均收益(當然,這並非排斥訂閱模式;事實上,“廣告+訂閱”是消費者內容業務的最終形態)。
DeepSeek近期備受矚目,部分原因在於其與Grok3形成了鮮明對比。DeepSeek的V3和R1模型性能卓越,是GPT-4級別中值得尊敬的競爭對手,其成功源於在基礎設施和模型層面的卓越工程設計。相比之下,Grok3只是購買了最頂級的Nvidia芯片,利用公司的網絡構建了迄今爲止最大的計算集羣,並推出了一個更好的模型,但並沒有好到天文數字的程度。
DeepSeek作爲一家中國公司,這一點至關重要,具體原因將在後文闡述。同樣重要的是,DeepSeek秉持開放實驗室的精神,定期發佈論文、完整的模型權重和底層源代碼。其模型不僅優於Meta的Llama模型,而且更加開放(不受“準開放”許可證的限制),爲“最低開放能力”樹立了標杆。任何性能低於或等同於DeepSeek的模型,都應毫無保留地實現開放。既然用戶可以直接運行DeepSeek,安全方面的顧慮便顯得多餘。而對於那些性能較弱且封閉的模型而言,因封閉性而損失的普及度和關注度,與所謂的競爭擔憂相比,顯得微不足道。
與此同時,DeepSeek和Llama都對定價構成了巨大的壓力;爲了應對這家中國研究實驗室的發佈,中美兩國的API成本均有所下降。從長遠來看,實現可持續盈利的途徑主要有三:一是在基礎設施方面擁有成本優勢(如谷歌),二是具備可持續的模型能力優勢(如Claude在特定領域的專長),三是成爲市場聚合者(這正是OpenAI應通過ChatGPT實現的戰略目標)。
AI芯片的現狀
當前人工智能領域呈現一片欣欣向榮的景象,這無疑是利好消息(僅對“末日概率”高度擔憂者除外)。即使競爭不斷壓低API的價格,但進一步激勵模型開發者們推出具有差異化的產品和功能,各研究實驗室競相投入新型基礎模型的研發,以期實現人工智能的自我完善。
英偉達及其代工商臺積電無疑是這場變革的最大贏家。DeepSeek的成功正導致中國市場對H20芯片的需求激增。H20是英偉達爲了遵守出口管制而推出的H200芯片的降規版本,降低了計算能力和帶寬。與此同時,xAI剛剛表明,參與競爭的最快方式就是購買最好的芯片。DeepSeek的創新將提高其他模型的效率,但有理由認爲,這些效率的提升是芯片禁令的間接影響。因此,對於那些能夠直接購買到頂級芯片的公司而言,過去可能沒有主動尋求類似的效率提升——但未來肯定會借鑑這些創新成果!——這也是可以理解的。
剛纔提到的後一點尤其對AMD構成挑戰。SemiAnalysis去年底發佈了一份詳盡且尖銳的分析報告,揭示了AMD作爲英偉達的競爭對手,其軟件相對於硬件而言是多麼不足。AMD承諾會改進軟件,但坦率地說,“卓越的芯片卻受限於糟糕的軟件”一直是AMD在過去五十年發展歷程中的常態。一些公司,例如Meta或微軟,可能會投入精力來開發更好的軟件,但研究實驗室既沒有時間,也沒有相關的專業知識。
不過,人工智能芯片面臨的主要瓶頸——尤其是在推理方面——不一定在於芯片速度,而是內存帶寬。而內存帶寬在現有工藝水平上仍然有提升空間。此外,爲了在一定程度上緩解使用效率較低芯片帶來的問題,一種方法是簡單地建設更多高功率的數據中心,而這恰恰是中國更擅長的。中國在這方面比美國更具優勢。然而,最重要的是,中國科技公司有足夠的動力和軟件技術實力,將Ascend系列芯片打造成一個有力的市場競爭者,尤其是在推理計算領域。
除了英偉達/臺積電和華爲/中芯國際之外,還有一類玩家也值得關注,那就是自行設計芯片的超大規模雲服務商。他們有的選擇獨立設計芯片,例如亞馬遜雲服務的Trainium和微軟的Maia;有的則與博通合作,例如谷歌的TPU和Meta的MTIA。這些廠商的研發投入在能力和側重點上各有不同——例如,谷歌在TPU上已經投入了十年之久,並使用TPU訓練自己的模型;下一代Anthropic模型也正在Trainium上進行訓練;Meta的MTIA主要用於推薦系統,而非生成式AI;而微軟的Maia項目還處於發展初期。但它們都有一個共同點,即這些芯片都由臺積電代工。
臺積電和英特爾
臺積電佔據主導地位其實並不令人意外。的確,包括本網站在內的許多文章都分析過英特爾的失利和臺積電的崛起。但即便英特爾能夠保持技術領先,它仍然面臨着一個轉型難題:英特爾需要從一家設計和製造自有芯片的集成器件製造商,轉型爲一家專業的芯片代工廠。後者需要具備完善的客戶服務、豐富的IP庫以及成熟的代工經驗,才能爲第三方客戶(例如我剛纔提到的那些企業)製造芯片。
舉例來說,英偉達即使在英特爾擁有領先的製程工藝時,也選擇在臺積電(以及三星)生產芯片。事實上,正是臺積電的創立及其純晶圓代工模式,才使得英偉達的誕生和發展成爲可能。
這也意味着,臺積電不僅具備先進製程產能,同時也具備成熟製程產能。世界上有大量的芯片——無論是用於AI服務器,還是從汽車、音響到冰箱等各種設備——並不需要最尖端的製程工藝。這些芯片可以受益於臺積電仍然在維護的、已完成折舊的晶圓廠所提供的低成本優勢,這些工廠主要位於中國臺灣。而臺積電又可以將這些現金流——以及先進製程不斷上漲的價格帶來的利潤——用於投資建設最先進的新工廠,從而進一步鞏固其在先進製程領域的領先地位。
先進製程晶圓廠的建造成本持續飆升,這意味着量產規模至關重要。因此,早在2013年本網站創立之初,我就清楚地認識到英特爾需要轉型爲一家代工廠。然而,不幸的是,英特爾並未採納我的建議,而是更傾向於坐享雲服務器需求帶來的股價飆升。時間快進到2021年,此時的英特爾——不僅失去了先進製程的領先地位,其雲服務器業務的市場份額也正不斷被AMD蠶食,而AMD正是憑藉臺積電更先進的製程工藝實現了強勢復甦。在PatGelsinger的領導下,英特爾試圖再次轉型爲代工廠。但不幸的是,公司日益萎縮的現金流甚至超過了其代工業務的客戶規模,而且其代工客戶也主要是一些實驗性芯片項目或x86架構的衍生產品。
英特爾的核心問題可以歸結爲上文提到的觀點:轉型爲代工廠不僅僅是擁有先進製程。英特爾本有可能與那些渴望採用全球最先進工藝的客戶合作,共同發展代工所需的技能。但一旦英特爾連先進製程的優勢都失去,就沒有任何優勢可以提供給客戶了。既然有臺積電這樣的成熟選項,蘋果、AMD或英偉達就沒有任何理由去冒巨大的風險與英特爾合作。
中國與變化的世界
我曾在去年秋天的《一個建設的機會》一文中講述過,爲什麼如此多的半導體產業最終落戶亞洲:
半導體對於硅谷的歷史至關重要,它們不僅賦予了這個地區名稱,更重要的是塑造了這裡的文化:芯片需要鉅額的前期投資,但相對於大多數其他製成品而言,它們的邊際成本極低;這種經濟現實推動了風險投資模式的發展,爲那些有可能通過規模化獲得理論上無限回報的公司提供了不受約束的啓動資金。這種模式在軟件領域表現得甚至更好,因爲軟件是完全可複製的。
這段歷史始於1956年,當時威廉·肖克利創立了肖克利半導體實驗室,以商業化他在貝爾實驗室幫助發明的晶體管;他選擇在山景城建廠是爲了離他生病的母親近一些。一年後,由羅伯特·諾伊斯領導的“叛逆八人幫”離開了肖克利實驗室,並在附近創立了仙童半導體公司。六年之後,仙童半導體公司在中國香港開設了一家工廠,用於組裝和測試半導體。組裝需要手動將導線連接到半導體芯片上,這是一項勞動密集且單調的任務,在美國工資約爲每小時2.50美元的情況下,在經濟上是不可行的;中國香港的工資只有美國的十分之一。四年後,德州儀器在中國臺灣開設了一家工廠,那裡的工資是每小時0.19美元;兩年後,仙童半導體公司在新加坡開設了另一家工廠,那裡的工資是每小時0.11美元。
換句話說,你可以這樣認爲,硅谷的經典故事並非完全真實。芯片確實存在邊際成本,但這種邊際成本,在硅谷創立後不到十年內,就被轉移到了亞洲。
我在那篇文章中回顧了這種外包是如何成爲美國政府的一項有意爲之的政策,並進一步討論了戰後“美國治下的和平”的全球秩序。這一秩序將美國消費市場置於全球貿易的中心,並以美元作爲結算貨幣。我還闡述了爲什麼這種秩序不可避免地導致了美國製造業的衰落,以及中國的崛起。現在回過頭來看,中國的體量實在太龐大了,以至於美國難以承受其帶來的影響。
芯片是現代經濟的基石,支撐着經濟的方方面面;人工智能的興起,以及由此可能帶來的巨大收益,只會使對芯片的需求變得更加迫切。
......
英特爾和先進製程
接下來是英特爾以及對本土先進製程產能的需求,這在某些方面是最難解決的問題。
首先,美國應該策劃將英特爾的x86芯片業務以象徵性的價格剝離給博通或高通。接受這項業務的公司的真正成本將是獲得有保證的訂單,不僅包括爲英特爾代工廠生產英特爾芯片,還包括將他們現有芯片的很大一部分訂單轉移給英特爾代工廠。這將爲英特爾代工廠的啓動奠定客戶基礎。
其次,美國應該提議補貼英偉達在英特爾代工廠生產芯片。是的,這是一項價值數十億美元的提議,但這是確保美國人工智能產業能夠立足於美國本土晶圓廠的最短、最快路徑。
第三,如果英偉達拒絕——考慮到更換代工廠可能帶來的風險,他們很可能會拒絕——那麼美國應該大量訂購英特爾GaudiAI加速器,建立數據中心來部署它們,並向希望構建自己AI模型的公司和初創企業免費提供這些加速器,但前提是所有相關技術都必須開源。
第四,美國應該大力補貼芯片初創公司在英特爾代工廠進行生產,但條件是,所有爲實際製造芯片而開發的衍生知識產權——與芯片本身“秘方”無關的基礎模塊——都必須開源。
第五,美國應該爲所有在美國製造的芯片上創建的模型提供保障,使其免受任何版權侵犯,但前提是,用於訓練模型的數據必須免費公開。
人工智能正處在一個激動人心的發展階段,但也面臨着非常不穩定的局面。我相信,這項計劃,以及它所包含的所有風險和犧牲,是確保所有正在萌芽的新興技術能夠真正紮根並改變世界的最佳途徑。