黃仁勳首提DeepSeek!英偉達蒸發的6000億又回來了
黃仁勳首度迴應DeepSeek?其實不準確!
在採訪中黃仁勳主動提及的DeepSeek,親自下場滅火,並稱贊到“(R1是)世界上第一個開源推理模型,這太令人興奮了,全球對我們開源的反響不可思議”!
黃仁勳大膽總結說:(有人說R1出現後)我們不再需要進行任何計算了。實際上,情況正好相反!爲啥呢?
在老黃看來,未來的AI仍然需要三方面的Scaling:
這也是黃仁勳想給投資者吃的“定心丸”,要知道在R1發佈當日,英偉達股價單日曾暴跌16.9%。據Yahoo Finance數據,英偉達股價在1月24日收於每股142.62美元,而在接下來的週一(1月27日),股價迅速下跌至118.52美元。這一事件在短短三天內使英偉達市值蒸發了6000億美元。
不過,英偉達的股價目前已經基本恢復,上週五,英偉達股價開盤報140美元。
在與DataDirect Networks(DDN)的聯合創始人和首席執行官Alex Bouzari所進行的這次採訪中,兩人還提出了其他方面的觀點,先來畫個重點:
以下是經整理的採訪原文,enjoy:
(有關DeepSeek的內容在採訪第三部分)
英偉達是“加速器”:計算讓AI變得可能
Alex Bouzari:歡迎來到《超越人工智能》。
黃仁勳:謝謝,能在這裡真是太好了,亞歷克斯。很高興見到你,你看起來很好。
Alex Bouzari:謝謝,你看起來也不錯,感謝你一如既往的支持。
黃仁勳:謝謝。
Alex Bouzari:好的,允許我必須告訴你,DDN是如何開始這個新產品的(Infina)。2017年,Nvidia說想要建立一個參考架構的超級集羣,我們需要數據部分。
離開那次會議時,我說,如果黃仁勳的遠見在未來十年內變爲現實,就需要一種完全不同的架構。它必須是一個高效可擴展的訓練架構,它必須具備低延遲,並且要在本地和多雲環境中分佈,負載不能移動,因爲成本太高了,圖像、視頻等都太大了,因此它必須是元數據和標記等。
因此,這就是它(Infina)的起點,我在白板上畫了它,我說這就是AI的架構應該是什麼樣的。大家看着我,都說,你完全瘋了。你在談論一些根本無法實現的事情。我說,我們換個角度來看,跳出問題的框架,忘掉我們要解決的東西,忘掉過去,忘掉文件系統等等,這花了七年時間。
黃仁勳:這就是兩個工程師CEO聚在一起時發生的事情(笑)。我認爲你剛剛描述的非凡旅程,從訓練模型到現在我們利用這些前沿模型和AI模型,轉向用於推理和解決大問題的AI應用。
人們常常忽視的一點是,在應用過程中需要的數據的重要性,而不僅僅是在訓練時。因此,當然,你希望在海量數據上進行預訓練,但在使用過程中,AI必須能夠訪問信息,而AI希望以信息的形式訪問信息,而不是原始數據的形式。這就是爲什麼將對象存儲和原始數據重新構建爲數據智能的原因,這爲DDN提供了新機遇,爲全球企業提供數據智能,因爲AI運行在這張信息網絡之上。這是計算和存儲的非凡重構,改變了我們之間的關係,以及你能向世界提供的產品類型。
Alex Bouzari:所以我們的看法是,必須要再說一次,這一切都是由你的願景驅動的。你基本上創造了這個行業,爲了讓這個行業能夠收穫成果,它正在改變我們所做的一切,工作、娛樂、休閒、健康、安全等等。
這是深刻的全球性轉變,是全球經濟在各方面的一個轉折。因此,爲了讓這一切發生,企業需要採用它,並且需要加快採用的步伐,這意味着投資回報率(ROI)必須能夠實現。爲了讓ROI能夠實現,應用層必須加速,而基礎設施必須高效,這些基礎設施駐留在數據中心或雲中。我們已經完成了這一部分。我認爲,最大的推動力和加速器是我們如何增強應用層,而你在這方面做得非常出色,尤其是在CUDA方面。
黃仁勳:感謝你使用“加速器”這個詞,我認爲在計算機科學的層面上,當然你我享受並觀察到摩爾定律的好處,計算變得越來越快,計算以同樣的價格和功耗變得更快,這意味着計算變得更加經濟實惠。因此,在我們職業生涯的前30年中,我們享受到了這一點,但在過去15年中,我們確實看到了一種平穩期,因此摩爾定律在很大程度上已經結束。
我們對計算機行業的貢獻,第一項根本貢獻是使用完全不同的架構和算法重構,極限加速。我們在計算機科學層面上共同努力,將順序處理轉變爲加速的並行處理。我們現在正在將計算加速到極限,這使我們能夠爲行業帶來成本效益和能源效率,並加速工作負載。
在這個基礎之上,我們發明了或使機器學習和人工智能成爲可能。我們現在的計算是如此高效,以至於你可以進入極端版本的計算,讓計算機自己找到洞察。
因此,在基礎層面上,我們必須做的一件事,以及我們在這條新產品線中共同完成的偉大工作。
談數字孿生:Omniverse將讓人同時生活在百萬個宇宙
黃仁勳:關於Infinia的事情是使用加速計算和人工智能,從你擁有的所有數據中學習,將原始數據轉化爲數據智能,將智能嵌入到模型中,從所有數據中提取其語義、智能和信息。現在,不再是服務原始數據,而是提供元數據、知識、智能和洞察力。令人難以置信的是,元數據、數據的語義層是高度壓縮的。
Alex Bouzari:是的,爲了實現這一點。因此,帶有多模態元數據標記和移動元數據的能力變得至關重要,否則經濟性根本無法實現。世界上沒有足夠的數據中心空間,也沒有足夠的電力來完成這樣的事情。
因此,元數據屬性非常關鍵,我們從Infinia開始,這就是我們關注的其中一項內容。我們說,必須有一個元數據豐富的基礎設施,能夠以非常低的延遲處理這些對象,這些對象需要被轉化以獲得洞察。因爲歸根結底,正如你所說,這就是數據智能。如果不從中獲得洞察,不獲得商業價值,也不爲消費者提供休閒價值,將所有這些數據引入環境中訓練模型又有什麼意義呢?所以,這必須有效,必須產生好處。
黃仁勳:這是一種與公司數據交互的新方式。你知道,與其檢索數據,不如弄清楚數據中有什麼。你可能會修改並存儲回去。在許多方面,你是在與公司的數據對話。你問公司的數據問題,你公司的數據迴應你,告訴你需要知道的事情。你可能在公司原始數據中有相當多的洞察,現在以這種語義形式存在。你希望有AI代理與來自不同部門的數據互動,查詢這些數據,生成報告,然後由另一個AI代理讀取、理解,將其與其他數據和其他智能結合,最終生成一些結果。
Alex Bouzari:所以,基本上,這些代理都是領域專家,每個代理在特定領域都是專家。他們是顧問,組織現在可以利用這些顧問來提高競爭力,更快地開發更好的產品,爲客戶帶來更多的價值,無論是產品還是服務。你將這些結合到Omniverse(注:Omniverse 是由 NVIDIA 開發的一個開放式虛擬世界平臺,旨在支持實時協作和3D內容的創建、模擬和共享)中,我認爲這是目前最了不起的東西。
與其在物理世界中做事情,你說,我要開發一種藥物來解決某種疾病,但這非常昂貴,需要數十億美元,耗時多年,還需要FDA(美國食品藥品監督管理局)的批准。我不知道它是否會成功。我們有10種不同的途徑需要探索,我們不能按順序進行,也不能並行進行,所以我們將在Omniverse中將它們作爲數字雙胞胎啓動,然後會得到反饋,告訴我們,如果你將路徑1的這些屬性與路徑4的其他屬性結合起來,將最大化成功的可能性,壓縮將藥物推向市場的時間,並最大化相關收益。
黃仁勳:對於正在觀看這一切的觀衆來說,這真的很有趣。我們的旅程始於高性能計算和高性能計算訓練基礎模型和前沿模型。這是高性能計算的極限版本。因此,Nvidia和DDN通過這個起點建立了我們的友誼和長期合作關係。現在,我們希望在訓練這些模型時,這些模型可以轉向世界企業,將我們的所有數據從原始數據轉化爲數據智能,現在我們的世界正在共同進入企業。因此,我們從高性能計算到企業,從公有云到現在的私有云和公有云。當你進入所有這些公司時,最終他們希望生活在數字世界中,因爲當我們生活在數字世界中,我們所做的一切都更快,這個Omniverse的理念使每個公司都能夠成爲數字雙胞胎,這真是深刻的。
Alex Bouzari:這太不可思議了,我不太確定人們是否能夠真正理解它的重要性。
黃仁勳:這是我們的旅程,也是下一步。所以我們已經從超級計算走到企業,現在我們要從企業走向企業的數字雙胞胎。爲了實現這一點,我們必須提取他們領域的數據,無論是3D數據、蛋白質、化學品、信息、時間序列,還是物理信息。我們希望提取所有這些數據,從中提取出表示和意義。一旦我們得到了它的表示,我們將在數字Omniverse中展示它。然後,全球的公司都可以在數字中擁有他們的表示。一旦我們進入數字世界,我們就可以同時進行1000個實驗。
因此,一旦我們擁有Omniverse,我們將擁有多元宇宙Omniverse,我們可以嘗試所有這些實驗。
Alex Bouzari:這就像在百萬個宇宙中同時生活。你選擇一個結合這些不同生活的組合,這個組合對你是最優的。這適用於企業和組織,也適用於有主權AI的政府,以造福他們的公民。它同樣適用於個人、消費者和健康。因此,你只需將所有這些內容分開並進行優化。
黃仁勳:我喜歡你能看到這一點。
Alex Bouzari:這正是正確的,但這非常深刻。第一次聽你談論Omniverse時,我想,哇,這就是AI引導我們的方向。
黃仁勳:AI需要將世界的原始數據提取出意義,在數字世界中進行表示。
Alex Bouzari:在數字雙胞胎中,因爲我們必須壓縮時間,降低經濟影響。因此,我們必須以更快的方式做到這一點。以數字雙胞胎的方式做到這一點是更便宜的。
黃仁勳:別無他法。是的,我們在數字雙胞胎中,一切都是這樣。
Alex Bouzari:是的,這就是企業採用AI的加速過程。它幫助他們在這個旅程中,從而真正壓縮時間並獲得顯著的好處。我們正處於這樣的時刻。
談推理進展:DeepSeek R1不代表計算已經終止
黃仁勳:現在我們已經構建了數據層,並在其上構建了一個智能層,這就是數據智能。在這個層的基礎上,我們將構建一個代理層。在信息世界中,我們稱它們爲代理AI。在物理世界中,我們使用體現於機器人的物理AI。所以我們現在又有了一個層。
真正令人興奮的是,你可能看到了DeepSeek發生的事情,這是世界上第一個開源推理模型,這太令人興奮了,全球對我們開源的反響不可思議。
Alex Bouzari:爲什麼人們認爲這可能是件壞事?我認爲這是件好事。
黃仁勳:首先,我認爲從投資者的角度來看,有一個心理模型認爲世界是預訓練的,然後進行推理,推理就是你問AI一個問題,它立刻給你一個答案,一次性回答。我不知道這是誰的錯,但顯然這個範式是錯誤的。這個範式是預訓練,因爲我們希望有基礎。你需要對信息有基本的理解才能進行第二部分,即後續訓練。
因此,預訓練仍然需要嚴謹,數據量要大,(還有)多模態數據,正如你提到的。我們將從語言中學習,當然還有語言和圖像、視頻、聲音,我們將把所有這些結合在一起形成我們的基礎知識,而這將持續進行。
第二部分,這是智能中最重要的部分,我們稱之爲後續訓練。但這是你學習解決問題的地方。你有基礎信息,瞭解詞彙、語法和基本數學是如何運作的。因此,你將這些基礎知識應用於解決問題。我們稱之爲後續訓練。
你可以使用強化學習和人類反饋。這是指使用人類示範的另一種說法。或者你可以使用自我練習的強化學習,或者你可以與另一個AI進行強化學習,一個教練,對吧?因此,與後續訓練相關的學習範式有很多種。
在這個範式中,技術在過去五年中發生了巨大的變化,計算需求也非常密集。因此,人們認爲,哦,天哪,預訓練的負擔要小得多。他們忘記了,後續訓練實際上是相當密集的。
現在第三個擴展法則是,你在回答問題之前進行的推理越多,思考越多,效果就越好。當然,我們記住了很多事情。比如,64的平方根是多少?你只是記住了這個。你可以對其進行推理,但不必這樣。因此,理想情況下,你已經記住了很多基本的事情,但大多數有價值的智能你仍然需要進行推理。因此,你必須應用第一原則,逐步分析。
也許你需要嘗試很多不同的實驗。根據一個實驗的結果輸出,它可能會爲你下一個實驗提供信息。因此,推理是一個相當計算密集的部分。因此,我認爲市場對R1的反應是,哦,我的天,AI完成了。
你知道,它從天而降。(有人說)我們不再需要進行任何計算了。實際上,情況正好相反。
Alex Bouzari:這完全相反,因爲DeepSeek正在做的是,它讓每個人注意到,有機會讓模型比我們認爲可能的更高效,因此它正在擴大並加速AI的採用。
R1現在可以與智能信息進行交互以解決問題。我認爲另一個極具賦能的東西是CUDA工具,我認爲這開啓了各種可能性,因爲人們可以將其與特定行業的數據結合起來,進行推理,比如生命科學、金融服務、自動駕駛等等。你將所有這些結合在一起,並與模型的進步相結合,再次加速AI的採用,這對Nvidia來說是件美好的事情。我認爲對DDN來說也是一件美好的事情,但這一切都是在應用層上發生的。是的,我認爲我們需要繼續改善你們在GPU上所做的事情,越來越快,降低功耗,推動數據中心和多雲環境的經濟效益。但這些都是結合在一起的。你知道,這個數據智能層,正如你所建議的,正在與數據中心的效率和應用層的加速相結合。
黃仁勳:真正令人驚訝的是,當你剝離一切時,這一切只是軟件,但今天我們談論軟件的方式與十年前談論軟件的方式截然不同,真是不可思議。
一個問題,Alex,人們會問,企業應該構建自己的AI還是僅僅使用公共雲中的AI?我認爲答案是,都是。原因是,如果你能使用公共雲AI,我絕對會從那裡開始。因此,那裡提供的東西對於許多個人使用來說,通用智能非常好,並且正在以指數速度增長。所以,真的非常適合入手。
然而,企業內部有許多不同的領域。例如,我們設計芯片的方式,我們編寫軟件的方式,我們的編程代碼,我們的Vlog編程,供應鏈管理的方式,都是深度專業化的,我們在這些方面的專業知識顯然是卓越的。因此,在這種情況下,我們傾向於構建自己的AI。我們擁有所有必要的工具包,從開源模型和開源工具包,如Nvidia的Nemo、Nvidia Nims,以及像Infina這樣的數據智能層。所有這些技術組件都可以用於入駐並策劃培訓課程和訓練自己的AI。因此,它將成爲所有這些AI代理的策劃。
公司將由自制的AI、合同AI、與第三方軟件平臺一起提供的AI以及公共雲中的AI組成。在你的公司內部,你將會是AI的AI,而AI內部是一個模型系統。你將有AI相互合作,解決大型問題,坐落在你公司的數據智能層之上。因此,對於組織來說,情況就是這樣。
Alex Bouzari:我認爲,作爲一個組織、一個企業,不論市場如何,你說得對,你的使命是什麼?你的目的是什麼?一旦你定義了這一點,你就必須進行差異化,而這種差異化只能來自AI在你特定組織中的專業應用。所以是的,你可以使用AI,但這只是消費而已。真正的價值是,作爲生命科學組織、金融服務組織,你的生活目的是什麼?那麼,你如何進行差異化?這非常特別,這就是你需要Nvidia提供的專業NIMS能力的地方,這就是Nemo發揮作用的地方,這就是我認爲DDN's Infina發揮作用的地方。它真的賦能了差異化,使其更具影響力並放大這種差異化。
黃仁勳:沒錯。
Alex Bouzari:我再次感謝你,作爲一個出色的合作伙伴,向我們展示了方向,謝謝你,內部擁抱我們的技術和視頻,這太棒了。對此我無以爲報,感謝你。