信達證券:AI呈現出巨大產業前景 關注相關產業鏈優質個股
智通財經APP獲悉,信達證券發佈研究報告稱,AI的發展目前正如火如荼地進行着,大模型不會滿足於幫人類查找資料這樣的小事,長期看它甚至具備改變部分行業運行邏輯的潛力。而當前伴隨推理性能的提升和推理成本的降低,許多算力密集型的場景有了落地的可能。世界模型可以幫助端側理解並預測世界,從而產生正確的決策。從雲來看,由於多模態數據的訓練與推理,算力需求總體仍然呈現迅速增長的趨勢;而從端來看,人形機器人、自動駕駛等重要賽道有望迅速前進,以突破目前的智能化瓶頸。AI呈現出巨大的產業前景,建議關注相關產業鏈優質個股。
AI 雲側:工業富聯(601138.SH)、滬電股份(002463.SZ)、生益科技(600183.SH)、深南電路(002916.SZ)、勝宏科技(300476.SZ)、寒武紀(688256.SH)、海光信息(688041.SH);
AI 端側:藍思科技(300433.SZ)、領益智造(002600.SZ)、鵬鼎控股(002938.SZ)、東山精密(002384.SZ)、樂鑫科技(688018.SH)、瑞芯微(603893.SH)、恆玄科技(688608.SH)、全志科技(300458.SZ)、兆易創新(603986.SH)、晶晨股份(688099.SH)等。
世界模型研究進展迅速,應用端機遇與挑戰並存。
長期以來,科學界一直渴望開發一個統一的模型,該模型可以複製其世界的基本動態,以追求通用人工智能(AGI)。世界模型尚無統一的定義,英偉達官網的定義爲:“世界模型是理解現實世界動態 (包括其物理和空間屬性) 的生成式 AI 模型。它們使用文本、圖像、視頻和運動等輸入數據來生 成視頻。通過學習,它們能夠理解現實世界環境的物理特性,從而對運動、應力以及感官數據中的空間關係等動態進行表示和預測。”
Sora 發佈之後,世界模型獲得了更爲廣泛的關注。從功能方面看,在許多用例中,Sora 確實具備一定的理解和預測世界的能力,且其生成的視頻在大部分時候也能有良好的一致性。但也有人認爲 Sora 僅是像素層面的生成,這會導致一些無法解釋的現象,這表明 Sora 並未理解物理世界。從技術架構看,Sora 是一種基於擴散的視頻生成模型。但是無論如何,Sora 的結果表明,擴展視頻生成模型是構建物理世界通用模擬器的一條有前景的途徑。
應用層面看,隨着視覺生成模型和多模態大模型的進展,世界模型在自動駕駛領域受到了廣泛的關注。使用基於擴散的視頻生成模型作爲世界模型可以部分解決信息丟失和建模效率低下的問題,近年來已有相關的研究在不斷進行。機器人領域的應用也是主要方向之一,世界模型讓機器人在現實中處理通用任務展示出巨大前景。傳統的機器人關鍵組件會被建模,機器人在執行任務時無需理解世界。而當機器人被部署在新的場景中時,機器人可能會手足無措,因此,世界模型對物理世界的理解和預測能力是機器人智能化的關鍵利器,LLMs 和世界模型被認爲是實現通用人工智能 (AGI)的可能途徑之一,它們可以成爲機器理解世界基本規律的起點。目前AI 發展迅速,大模型正快速學習如何理解物理世界,世界模型也有望迎來快速迭代時期。
在近期發佈的大模型中,o3-mini 可以模擬生成一個小球在四維超立方體內彈射的 Python 代碼。而 Grok3 則可以模擬航天器任務,生成的 3D 動畫準確描述了飛船、地球、太陽、火星的位置關係。這些成果有可能從底層催動世界模型的進展,讓 AI 的智能化進入更高的水平。
衆多廠商推出世界模型,相關領域已展開角逐。
英偉達推出 Cosmos,賦能機器人和自動駕駛開發者。Cosmos 世界基礎模型是一套用於物理感知視頻生成的開放式擴散和自迴歸 Transformer 模型。這些模型已基於 2000 萬小時的真實世界人類互動、環境、工業、機器人和駕駛數據,訓練了 9,000 萬億個 token。李飛飛創立 World Labs,探索從 2D 到 3D 的路徑。
World Labs 是一家空間智能 AI 公司,由在AI 學術領域享有盛譽的李飛飛博士創立。World Labs 致力於構建空間智能大型世界模型 (LWM) 來感知、生成 3D 世界並與之交互。其目標是將 AI 模型從像素的 2D 平面提升到完整的 3D 世界。World Labs 僅創立了三個月,便吸引了英偉達、AMD 等公司的融資,估值超過 10 億美元。
谷歌旗下 DeepMind 推出 Genie2,性能強大用例廣泛。Genie 2 是一種自迴歸潛在擴散模型,在大型視頻數據集上進行了訓練 。通過自動 編碼 器後 ,視頻 中的 潛在 幀被 傳遞到 大型transformer 動力學模型,該模型使用類似於大型語言模型使用的因果掩碼進行訓練。在推理時,Genie 2 可以以自迴歸方式進行採樣,逐幀執行單個作和過去的潛幀。谷歌使用無分類器的指導來提高可控性。在 DeepMind 官網上,Genie2 的能力也非常強大。
崑崙萬維發佈Matrix-Zero,國產模型緊追不捨。崑崙萬維發佈的 Matrix-Zero 世界模型包含兩款子模型,其中,3D 場景生成大模型支持將用戶輸入的圖片轉化爲可自由探索的真實合理的 3D 場景。而可交互視頻生成大模型,提供以用戶輸入爲核心驅動的可交互空間智能視頻生成方案,支持根據用戶實時輸入生成互動視頻效果,具備更精準控制的 action model。
無論是北美還是國內,推理成本的降低及推理性能的迅速提升趨勢非常顯著。微軟董事長 Satya Nadella 曾在法說會表示,每代硬件的性價比提高 2 倍以上,而由於軟件優化,每代模型的性能提升10 倍以上。DeepSeek 卓越的性價比讓人印象深刻,據 Semianalysis觀察,在 GPT-4 上同樣有類似的趨勢,即每過一年,算法改進和優化使得推理成本降低 10 倍,同時性能提升 10 倍。