李飛飛最新NoPriors專訪:空間智能、世界模型與無畏的創造

未經許可不得轉載, 務必保留公衆號名片

Web3天空之城·整理製作

【城主說】本次訪談深入探討了李飛飛博士的最新動向與深刻見解。她詳細闡述了其新公司 World Labs 的核心使命——開發“空間智能”與3D生成式基礎模型,並解釋了爲何這項技術對實現完整的人工智能至關重要。訪談回顧了 ImageNet 的誕生歷程,強調了數據、遠見和無畏精神在科學突破中的決定性作用。最後,李飛飛博士分享了她對機器人技術、跨學科團隊建設以及以人爲本的AI未來發展的樂觀願景,強調AI的最終目標是賦能於人,解決醫療等領域的重大挑戰。

核心觀點

• 空間智能是AI的基石 :人工智能若要完整,就必須具備理解、推理和生成3D世界的能力,因爲這是我們所處物理世界的基本屬性。

• 構建3D世界模型是下一個前沿 :繼語言模型之後,攻克3D生成式基礎模型是解鎖大量應用(從創意設計到機器人技術)的關鍵,也是當前AI領域最困難的問題之一。

• 無畏精神驅動創新 :無論是創建ImageNet還是創辦新公司,敢於挑戰不確定性、大膽假設的“無畏”精神是推動科學和技術突破的核心動力。

• AI的終極目標是賦能人類 :技術應以人爲本,作爲協作工具來增強人類的能力,以應對醫療、教育等領域的複雜挑戰,促進社會福祉。

• 數據與模擬至關重要 :高質量、多模態的數據(包括被低估的觸覺數據)和高保真模擬環境,對於訓練更強大的機器人和通用智能體是不可或缺的。

Sarah: 大家好,聽衆朋友們。今天我們的嘉賓是李飛飛博士,她是計算機視覺和深度學習領域的先驅。她創建了ImageNet,這個開創性的數據集幫助引發了深度學習革命。李飛飛是斯坦福大學教授,也是斯坦福以人爲本人工智能研究院的聯合主任。她還曾領導谷歌雲人工智能部門,爲國際政策制定者提供諮詢,最近還聯合創辦了World Labs,一家致力於開發空間智能人工智能的公司。飛飛,感謝你今天加入我們。

李飛飛: 謝謝邀請。

Sarah: 這會很有趣。在過去的20年裡,您對科學和政策做出了非凡的貢獻。我先從最大的問題開始。比如,爲什麼現在創業?

李飛飛: 因爲在我內心深處,我渴望創造。我認爲這是一個至關重要、充滿樂趣和令人興奮的時刻,可以構建一些每個人都能使用的非凡技術。我對空間智能以及能夠賦能如此多的人和如此多的用例的3D世界模型深信不疑。而且我認爲這將會非常令人興奮。而且我可以與一個極其、極其傑出的年輕技術專家團隊一起做到這一點。

Sarah: 我想回到你正在合作的人這個問題上來,因爲我認識你的一些聯合創始人,而且不久前我還在拼命地試圖說服他們創辦一家公司。然後他們說,哦,不,我們現在和 Fei-Fei 有一個更大的使命。

定義空間智能

Sarah: 什麼是空間智能?你能爲更廣泛的受衆定義一下嗎?

李飛飛: 對我來說,空間智能是理解、推理、互動和生成3D世界的能力,因爲無論你怎麼說我們可以投影它,我們的世界從根本上來說都是3D的。而且它是3D的,因爲物理上它就是3D的。而且在數字層面,如果存在真正的3D呈現,那麼我們可以更容易地實現很多事情,無論是設計、創造、導航,還是模擬,或是體驗AR、VR,對我來說,這些都是空間智能的一部分。

再次強調,我認爲真正讓我興奮的是人類擁有空間智能。這是我們核心智能能力的一部分。動物也擁有空間智能。整個進化過程也與空間智能的進化緊密相連。所以它是如此的根本。如果沒有空間智能,人工智能將是不完整的。

李飛飛: 這如何轉化爲你正在用你的公司做的事情?或者說,你能分享一些關於這相對於你正在構建的東西意味着什麼的信息嗎?

李飛飛: 是的,我們正在破解人工智能領域最難的問題之一,即構建從根本上是3D的世界模型。因爲一旦你攻克了這個問題,你就可以解鎖大量的空間智能問題。據我們所知,我們是第一家解決這個問題的公司,即3D生成基礎模型問題。

世界模型的願景與挑戰

Sarah: 我有很多問題。但是,既然你首先將這一點描述爲3D對於理解世界的至關重要性,這是否意味着你認爲,World Labs或其他學術界或公司創建的世界模型,將來會像現實一樣準確,比如能夠呈現物理規律並理解世界,從而使我們能夠做更多的事情?

李飛飛: 是的,它應該是現實般準確或合理的。所以你可以創造一個奇幻的世界,但它應該是合理的,因爲它的幾何結構和物理特性需要是合理的。而這對於空間智能來說是至關重要的。

Sarah: 這是否意味着你有一個特別的觀點,從神經科學的角度來看,比如視覺智能有多麼重要?我的意思是,你一直是計算機視覺領域的領導者,對吧,但是視覺智能與大型語言模型和文本智能相比,有多麼重要?

李飛飛: 實際上,我的確有。我認爲從神經和認知科學的角度來看,空間智能是進化必須爲動物解決的一個非常困難的問題。真正有趣的是,我認爲動物在某種程度上解決了這個問題,但並沒有完全解決。這是最難的問題之一,因爲動物必須解決的問題是什麼?動物必須進化出在某種程度上收集光線的能力,我們通常稱之爲眼睛。然後通過這些眼睛收集的光線,它們必須在某種程度上於腦海中重建一個3D世界,以便它們能夠導航並做事情。當然,它們可以互動。對於人類來說,我們在操作能力方面是最強的動物,我們可以做很多事情。所有這些都是空間智能。對我來說,這僅僅根植於我們的智能。

有趣的是,即使在動物中,這也不是一個完全解決的問題。我們,例如,就人類而言,對吧?如果我現在讓你閉上眼睛,畫出或構建一個你周圍環境的3D模型,這並不容易。

Sarah: 在經過訓練之前,我們沒有那麼強的能力來生成極其複雜的3D模型。

李飛飛: 你知道,我們中的一些人,無論是建築師、設計師,還是隻是接受過大量訓練且天賦異稟的人。那是一件很難的事情。想象一下,你可以在指尖上更輕鬆地完成它,並且允許更流暢的交互性和可編輯性。對人們來說,那將是一個完全不同的世界,絕非雙關語。

AI缺失的下一個領域

李飛飛: 是否還有其他像空間智能這樣的大領域,你覺得從模型的角度來看,它還沒有得到充分的發展,或者其他你認爲普遍存在的缺失,隨着我們構建這種人工智能的未來,我們應該隨着時間的推移關注,或者人們應該構建出來?我只是想知道,除了3D和世界生成等其他大問題之外,因爲感覺我們已經隨着時間的推移解決了一些大問題,還有其他一些問題我們正在努力解決。

李飛飛: 我們正在某種程度上解決語言問題。我認爲語言問題在很大程度上已經解決了。而3D,在我看來,和語言一樣至關重要且困難。那麼還有什麼問題沒有解決呢?我的意思是,整個情商領域是我甚至不知道該如何着手解決的問題。

李飛飛: 我認識很多人都沒能解決這個問題。

李飛飛: 所以,那纔是實現通用人工智能(AGI)的時候。

Sarah: 我可以告訴你,用於訓練的數據不會來自硅谷的人們。不要低估硅谷。我會把自己歸爲這一類,但我認爲我們可能需要更廣泛的人羣參與。

李飛飛: 是的,沒錯,我同意。

Sarah: 但這些是三個大類。

李飛飛: 說實話,我不知道,你們怎麼看,伊蘭和莎拉?

李飛飛: 我認爲這很大程度上取決於你在每個模型中封裝的內容。所以我同意你關於這三個方面的框架。然後像某些東西,你知道,空間智能,我假設它也深入到不同類型的物理模擬和世界模擬中。而且,你知道,就像那些是很大的領域,我認爲很多人沒有在研究,但我認爲它們真的很有趣或很重要。而且存在着它的宏觀和微觀尺度。微觀尺度最終會變成材料科學和其他非常不同的東西,與你所說的內容不同,它更像是分子建模,或者...

李飛飛: 對。並且這超出了當前人工智能的定義,但我認爲它們會因此而得到增強。當然,有機器人技術,但機器人技術很大程度上是一個系統集成問題,就像,你知道,即使你觀察動物,也不僅僅是大腦中的計算本身。

李飛飛: 是的,相對於動物擁有的特定系統,很多這些事情在空間智能方面似乎更加分散。而且在某些情況下,正如你所說,並不像人們想象的那麼集中。因此,開始根據有機體中更分散的智能模型,而不是中樞神經系統,進行思考是非常有趣的。但是,是的,我認爲我認爲這是非常有趣的事情。

機器人、模擬與數據金字塔

Sarah: 飛飛,你也做過機器人技術和類物理智能領域的工作。我認爲,對於機器人基礎模型和驅動的數據層級來說,你知道,人們當然想使用視頻,對吧?因爲那是我們可以獲得的。關於模擬以及今天你能從中獲得多少,存在一個很大的問題。也許人們沒有看到未來可供我們使用的質量和物理特性。然後還有,你知道的,接近具身性的,比如不同形式的遙操作,以及類似具身數據收集。這是你腦海中的層級結構嗎?或者你認爲人們低估了模擬和世界模型在未來的作用?

李飛飛: 是的,好問題。首先,正如你所說,我的確從事機器人研究工作,尤其是在我在斯坦福的實驗室裡。我毫不懷疑人類將進入一個與機器人共存的時代。而且,“機器人”一詞並不一定指人形機器人。機器人可以呈現各種各樣的形式和形狀。實際上,幾年前,我的實驗室寫了一篇非常有趣的論文,關於形態智能,即智能體的形態實際上可以通過優化它們試圖完成的任務來改變。所以我們應該比僅僅想象人形機器人更有想象力。

說了這麼多,關於如何訓練機器人,你提到了整個數據,有些人稱之爲數據金字塔或數據蛋糕之類的。我同意。我認爲這將是許多不同形式數據的混合。我還認爲模擬被低估了。實際上,很多專家和業內人士並沒有低估它。如果你看看很多機器人公司,他們都在研究模擬和合成數據。我也認爲我們必須意識到,與語言模型甚至與空間智能基礎模型不同,機器人是一個高度多模態的系統。我認爲真正被低估的是觸覺,依我之見。如果我們想要進行操作,而不僅僅是導航,觸覺就顯得尤爲重要。我認爲將觸覺真正整合到視覺、感知和空間數據中的能力是絕對關鍵的。

機器人的形態與未來

李飛飛: 你說過的一件事我覺得非常有趣,那就是機器人可能適應或採用哪些不同的形態形式。關於潛在的未來,人們提出了兩種相互對立的論點。一種論點是,從供應鏈的角度以及管理構建和製造規模的角度來看,形態因子的數量將會大大減少。另一種論點是,專業化的經濟價值非常高。因此,隨着我們走向機器人驅動的未來,將會出現成千上萬種不同的形態因子。對於我們可能在這兩種觀點之間最終落腳於何處,你有什麼看法?

李飛飛: 我認爲我們正處於一個梯度下降的過程中,最終目的是優化生產力和效率。我的假設是,不同任務的需求如此之多,以至於只有極少數的形態或堅持一種形態是能源效率低下的。並且許多任務可以並且應該由能源效率更高的形態因子來完成。只是一個極端而瑣碎的例子。如果我們把機器人放到水下,它們就不應該做成人形。它們最好是魚的形狀,對吧?想想能源效率就明白了。飛行也是一樣。我認爲人形……我們的飛機正變得越來越像機器人。

3D生成模型的近期應用

Sarah: 所以我確實認爲會存在多樣性。機器人技術是未來一個潛在的應用領域。首先你是一位科學家,但同時,你也參與了Twitter董事會與初創公司相關的工作。你能想象到哪些近期可實現的、用於生成3D世界的商業應用?

李飛飛: 我相信創造力是一個非常令人興奮的領域,在這個領域中,人類可以通過人工智能和空間智能獲得超能力。在這裡,我將它類比於軟件工程。如果你看看當今大型語言模型在軟件工程領域的成功,包括像Cursor和Windsurf這樣的應用程序以及所有這些,你看到的是人工智能和人類之間的大量協作。而且這種協作體現在不同的技能水平等等方面。我認爲創造力也會類似,無論是設計師、3D藝術家、視覺特效藝術家,甚至是營銷人才和遊戲開發者,在設計和創造3D空間方面都有大量的需求。即使對於訓練有素的專業人士來說,這從根本上說也是一個非常困難的問題,如果我們能正確地進行協作,擁有一個協作者將會非常有趣。所以我將創造力看作是一個非常令人興奮的領域。

我也確實認爲,我們在元宇宙或增強現實、虛擬現實方面所等待的很多東西是內容創作。我理解硬件本身需要不斷髮展,但我也認爲在軟件方面,我們正在尋找內容創作。這自然而然地適用於3D建模和3D或生成式空間模型。這是另一個值得關注的有趣領域。

Sarah: 你對於世界模型是否是可擴展強化學習的一個有趣答案,以實現更具泛化能力的智能體,有什麼強烈的觀點嗎?

李飛飛: 實際上,我的確認爲它是這樣的。就像我說的,如果沒有空間智能,人工智能是不完整的,因爲人類是在3D世界中互動的。在數字世界中,我們需要各種各樣的互動。你知道,以設計爲例。這是一個非常深刻的領域,你知道,當我們思考設計時,我們會在腦海中優化很多東西,無論是美觀、效率還是最優化等等。這非常自然地適用於強化學習的設置。

Sarah: 我想,在嘗試沿着這條道路,即設計和訓練世界模型的過程中,最大的挑戰是什麼?我猜想其中之一是,例如,你研究過圖像,研究過視頻,但是我們擁有圖像和視頻,而我們沒有很多,你知道,像你正在構建的那樣,以某種格式呈現的3D世界。

李飛飛: 是的,數據絕對是一個挑戰。你完全說對了。你知道,要創建世界模型、3D基礎模型,我們需要越來越複雜的數據工程、數據採集、數據處理和數據合成。所以,我非常羨慕我的自然語言處理大語言模型同事們,他們在互聯網上擁有如此豐富的數據,而我們不一定有這種優越條件。所以,這絕對是一個挑戰。

另一個挑戰是3D,這有點諷刺,對吧?我們每個人每天都在使用3D,就像在很多場合一樣。基本上,你睜開眼睛,你所體驗的整個生活都是3D的。即使我們一直在電腦上打字或者盯着屏幕,但與語言相比,它仍然不是一種更容易交付到人們手中的形式因素。語言是如此簡單。而且它也是一種非常主動的形式……它不是被動地觀看。沒有人醒來說,我就要坐在這裡看3D,你知道嗎?所以,這給產品化以及如何以正確的方式進行產品化帶來了挑戰。你曾經玩過《第二人生》之類的遊戲嗎?

Sarah: 或是其他什麼遊戲?

李飛飛: 我不是一個遊戲玩家,但是我的孩子們喜歡《我的世界》。

Sarah: 我本來想問你,是否存在你想要體驗或想象的世界。

李飛飛: 莎拉,這是個好問題。你知道,我渴望看到各種各樣的世界。我喜歡看到我未曾見過的世界。例如,像不斷放大,進入微觀世界,或者,你知道的,進入引擎的內部,瞭解引擎的實際運作方式。我知道,當然,我理論上知道它是如何運作的,但是親眼看到它,體驗它,甚至,你可能會覺得好笑,我想進入洗碗機內部。只是體驗那是什麼。如果我們能夠創建任何事物的世界模型,所有這些都可以以虛擬方式完成。

回顧:ImageNet的誕生

Sarah: 好的,我想阿拉德和我都很想談談您過去的職業生涯,以及可能爲正在進行研究或試圖在人工智能領域產生影響的人提供的一些見解。在此之前,我問安德烈·卡帕斯我應該問你什麼。他說,你知道,李飛飛在抱負和思考數據方面真的很神奇。你應該問問她關於她的博士學位,比如,以及與皮埃特羅一起創建那個一對一數據集的事情,因爲它具有指導意義。所以我必須問問你這件事。

李飛飛: 你知道,首先,我必須說,當你的學生比你更有名,取得的成就比你更多時,這總是最棒的事情。這讓我感到非常自豪。爲安德烈感到非常自豪。我很驚訝他記得我的博士研究。所以,是的,這是真的。那,嗯,天哪,要追溯到2003年左右,當時世界纔剛開始觸及互聯網的皮毛,數據還算不上什麼。但從事計算機視覺研究時,我們,我的博士研究真的試圖讓物體識別發揮作用。那個問題就是,當你看到一張圖片時,要識別出貓、狗、微波爐、椅子等等所有東西。我們當時開始假設數據很重要,但我們毫無概念。沒有比例定律。我們不知道,你知道的,數據能走多遠。我們想要的只是,如果我們有一個機器學習算法,無論是神經網絡還是那時非常流行的貝葉斯網絡,或者是支持向量機,我們需要一些數據來訓練。並且沒有數據可供訓練。

作爲一名博士生,你當然想畢業。然後,Pietro就說,這樣吧,Feifei,整理一個數據集。我,你知道,我當時在想,是的,我的確需要整理一個數據集,因爲現有的每個數據集都太小了。我只是不太信服。然後Pietro和我一直在討論,你知道,到底是15個不同的東西還是30個不同的東西,然後更可怕的是,博士導師說了三位數100。我當時就想,你知道,這工作量太大了。但我內心深處知道,從數學的角度來看他是對的,爲了推動模型泛化,我們需要足夠的數據,至少要足夠。所以,你知道,我確實在我的書《我所看到的世界》中寫到了這個過程,我偶然發現了一本詞典。而且那真的是爲了我自己的英語學習,那本詞典,我想是韋氏詞典,如果我沒記錯的話,它只是隨機地包含了一些單詞的視覺描述。我甚至不知道他們遵循什麼規則,說實話,有些是花,有些是自行車,有些是狗。我當時就想,好吧,這實際上,你可以稱之爲作弊或者工具。我抓取了101個這樣的詞語。這真的讓我博士生導師有點忍俊不禁,因爲他會說,啊,是啊,你就是想比我要求的多做一點,你知道,想挑戰我。所以我就那樣做了。而且我得說,我仍然記得,我下載或者說,你知道,嘗試從谷歌下載,那時候谷歌還很新。而且那時候的谷歌圖片搜索非常糟糕,你知道,和今天相比。我不得不做大量的清理工作。有段時間,我變得非常絕望。我直接讓我媽媽做圖片清理,因爲我在電腦上寫了一個小界面。她不懂電腦,但至少她知道點擊,點擊。所以她幫我做了一些事情。

職業生涯的決定性時刻

李飛飛: 我的意思是,你在人工智能領域擁有着最輝煌的職業生涯之一。而且正如你所說,你的許多學生也都同樣在整個領域、整個行業、甚至整個世界取得了非常偉大的成就。當你回顧迄今爲止的職業生涯時,你會想到哪兩三個時刻?當然,你的職業生涯還有很長的路要走。但我只是有點好奇。我的意思是,顯然,你在圖像和視覺識別相關係統以及各種方面都做了很多事情。但我只是有點好奇,比如,當你想到過去20年時,考慮到你所做的一切,什麼是最突出的?

李飛飛: 哦,謝謝你問這個問題。當然,ImageNet是其中之一……ImageNet由多個時刻組成,從早期的掙扎和被告知我不會獲得終身教職,到真正意識到亞馬遜的Mechanical Turk來救援,再到AlexNet獲勝的那一刻。並且在幾年前,我和傑夫·辛頓在多倫多參加了一個活動。他當時公開表示,這件事是多麼具有決定性意義。他甚至有點抱歉,認爲 ImageNet 沒有像神經網絡那樣被廣泛認可。因此,這段歷程非常有意義。對於科學家來說,這種意義不在於認可或獎勵。而在於你做出了改變。就像那個沒人相信的猜想,那個沒人相信的假設,我們最終實現了它。這是其中一個線索。

Sarah: 爲了確保那些不熟悉的商界人士瞭解,ImageNet 是一個大規模的數據集,擁有數百萬張帶標籤的圖像,涵蓋數千個類別,而不僅僅是 101 個,對吧?1500萬張帶標籤的圖像。1500萬張已標註圖像。謝謝你,李飛飛。這促成了深度學習領域的驚人突破,特別是 AlexNet,以及計算機視覺領域整體的巨大進步。是的,極大地推動了機器視覺的發展。

李飛飛: 我還記得在 2016 年或 2017 年,我曾經展示一張幻燈片,內容是人工智能的歷史,或者,你知道的,那時主要是卷積神經網絡 (CNN) 和循環神經網絡 (RNN),生成對抗網絡 (GAN) 纔剛剛興起。我把 ImageNet 和 AlexNet 看作是人工智能發展史上具有開創意義的時刻之一,是定義人工智能進步的極少數事件之一。顯然,現在我們有了 Transformer 模型,或許還有擴散模型之類的,但那(ImageNet和AlexNet)確實是一個巨大的突破。

李飛飛: 是的,謝謝。另一個讓我非常自豪的時刻是安德烈(指 Andrej Karpathy)和賈斯汀·約翰遜的畢業論文。在我看來,那是語言和圖像首次通過爲視覺世界添加標題和編寫故事而融合的時刻,這對我來說意義重大,原因有兩點。

其中之一是我真的以爲,我可沒開玩笑,在我的博士生涯結束時,我認爲如果我能活到100歲,那纔是我們或許能夠解決的問題。也就是圖片的敘事。所以我進入我的職業生涯,就像我第一年當助理教授一樣,心想着,好的,我要做ImageNet來解決物體識別問題。然後我將用我餘下的整個職業生涯來解決這個敘事問題。然後當Andrej,以及稍晚些的Justin Johnson進入我的實驗室時,那是大約2013年、2014年,深度學習的開端。然後突然間,序列模型的組合,當時是LSTM,還不是Transformer模型,但是LSTM和CNN就這樣炸開了花。圖像描述工作,Andrej和我的工作與谷歌的工作一起,是最早完成併發布的。那對我來說真的是,我幾乎感到,它讓我如此自豪,我幾乎感到了一場危機,就像,我將在餘下的70年或65年裡做些什麼呢?所以這真的令人興奮,這個領域發展得如此之快,你知道的,發展得如此之快。

對研究者的建議:無所畏懼

Sarah: 我可以再問你一個關於這個問題的問題嗎,就因爲你已經,你知道的,取得了如此驚人的進展,而且非常高效,對吧?就像你我之前在線下談過的那樣,你覺得在人工智能研究領域存在超越大型企業資助實驗室的登月計劃和創造力,這一點非常重要,對吧。而且,你知道,你指出了幾個時刻,它們來自於創造力以及學術界的研究,你對人們有什麼建議,關於是否仍然存在這種機會?或者,你知道,從現在開始,一切都只是 100 億美元的訓練運行了。

李飛飛: 我唯一的建議,我仍然在我的公司、我的實驗室裡這樣說,就是要無所畏懼。我認爲科學家、技術專家和企業家都必須無所畏懼。你知道,最終你必須弄清楚,你是否需要 100 億美元的運行?或者到那時你來找莎拉申請資金。可能兩者都需要很多。是的。或者你必須弄清楚,你知道,我不知道,數據方面的問題。有時候,無畏是一種非常有趣的狀態,你可能有點妄想和瘋狂,但也可能僅僅是理性上的大膽。它介於兩者之間。因爲如果你過於理性,就顯得不夠勇敢。你就無法發現足夠大的問題。但如果你完全瘋癲,那麼我不知道,可能會出現很多問題。所以要無畏。要勇敢。對我來說,即使我已經這麼老了,我仍然是這樣感覺的。我創辦了我的初創公司WorldLabs,是因爲我想無畏地解決空間智能這個問題。

Sarah: 作爲解決問題的一部分,隨着時間的推移,你已經與世界上一些最好的AI研究人員和最好的工程師合作。

招募無畏者:構建多元化團隊

李飛飛: 你如何在你公司的背景下看待這件事?比如,你們正在嘗試招聘哪種類型的人?目前有空缺職位嗎?還有,數據看來這是一支非常棒的團隊。我只是好奇,你們想增加哪種類型的人,以及你們如何隨着時間的推移考慮這件事?

李飛飛: 是的,我們有空缺職位,並且目前我們非常希望爲公司招聘最優秀的工程師以及產品思考者。所以,如果你是一名工程師、人工智能研究員或產品人才,並且熱衷於加入最有才華的團隊並解決這個問題,請加入我們。

那麼,我們招聘什麼樣的人呢?首先,我們確實招聘具有思維多樣性的人。這就是爲什麼,你知道,你們稱我們爲人工智能公司,但如果你深入瞭解,我們會發現我們有計算機圖形學專家。我們擁有計算機視覺專家。我們擁有數據專家。我們擁有,你知道的,生成式人工智能專家。我們擁有機器學習基礎設施專家。我們擁有優化專家。因此,聘用多元化且真正有才華的團隊至關重要,因爲像空間智能這樣艱鉅的問題並非同質化問題。解決這個問題需要來自各種背景的人才。然後我也尋找無畏精神。

李飛飛: 你如何做到這一點?例如,你如何識別某人的背景或思維過程中是否具有無畏精神?

李飛飛: 這是他們的背景決定的。你和他們交談。你能感覺到某人是否無所畏懼。你知道,你能感覺到是什麼驅動着他們。你知道,你能感覺到他們提出的問題。如果他們開始問你很多關於,我不知道如何完成這件事的問題。我的意思是,當然,你必須問這些問題,因爲你想完成它。但如果你感覺到這來自於害怕解決問題的角度,那就不是無所畏懼。但那些無所畏懼的人,他們富有創造力。他們有雄心壯志。他們並不畏懼不確定性或未知。我真的很喜歡這一點。

終極願景:以人爲本的人工智能

Sarah: 嗯,我想阿拉德和我,你知道,我們努力做與無畏之人做生意的生意,並且希望那些人在技術上富有創造力。最後一個更廣泛的問題想問您,因爲我認爲您工作的一個重要部分也在於思考如何將更多人引入人工智能領域,您知道,共同指導斯坦福以人爲本人工智能中心。如果您設想一下,您知道,不是爲了用書開玩笑,但如果您設想一下幾年後,在您上一組預測之後的世界,您對以人爲本的人工智能最樂觀的看法是什麼?

李飛飛: 是的,謝謝您提問。事實上,我職業生涯中另一點讓我感到非常自豪的是創立了以人爲本人工智能研究所,HAI,以及不斷朝着這種思維方式邁進。我想構建一個人工智能協作並賦能於人的世界。我仍然相信我們的世界,我們人類的世界需要以人爲本,你知道,在那裡,愛、關係,以及各個社羣的繁榮。這些都非常重要,公正也是,這些都是非常重要的價值觀。而且我認爲任何機械裝置,無論是人工智能、飛機還是生物技術,都不應該剝奪這些。但考慮到那些關鍵價值觀,擁有人工智能來賦能我們真的非常重要,因爲有太多尚未解決的問題。

我曾經工作過的一個應用領域是醫療保健,例如在斯坦福大學,對吧?如果你看看醫療保健,從藥物發現到治癒疾病,到能夠覆蓋全世界人民的診斷,到能夠讓全世界人民都能獲得的治療,再到整個醫療保健服務,如何讓老齡化變得更好,如何照顧慢性疾病,如何處理精神健康,所有這些,我們不存在人類過剩之類的問題。我們缺乏幫助。你知道,我們缺乏科學發現,我們缺乏診斷,我們缺乏精準醫療,我們缺乏更安全有效的醫療保健服務和老齡化幫助等等。而這就是我相信的。我認爲人工智能是幫助人們的工具。

Sarah: 是的,我認爲我和很多人共同投資了一系列公司,我希望這些公司能在這方面發揮作用,從架橋到開放證據再到後期。但是正如你所說,存在着一個巨大的問題譜系。老實說,過去15年來,我對普遍的技術和醫療保健領域的應用並不那麼樂觀。但這一次感覺確實不一樣。實際上,這絕對是一件整體利大於弊的事情。

李飛飛: 是的,實際上在此之前我創辦了一家數字健康公司。

Sarah: 我希望,人們談論了幾十年的很多事情最終能夠實現。

李飛飛: 看起來人工智能是實現這一目標的絕佳傳遞機制。

Sarah: 完全同意。好的,非常感謝您,飛飛。

李飛飛: 太棒了。

Sarah: 這次談話令人鼓舞,並且很高興更多地瞭解了世界實驗室。非常感謝。

李飛飛:謝謝你,莎拉。非常感謝你邀請我。