AI週報 | OpenAI發佈GPT-4.5;DeepSeek最高日賺346萬元
OpenAI發佈GPT-4.5,API價格昂貴
北京時間2月28日凌晨,OpenAI發佈GPT-4.5。“這是我們迄今爲止最大、最好的聊天模型,是在擴大(scaling up)預訓練和後訓練道路上邁出的一步。” OpenAI介紹,GPT Pro用戶將能最早使用上該模型。OpenAI強調了該模型有更強大的“情商”。定價上,GPT-4.5預覽版的API(接口)調用價格爲每百萬token輸入(input)75美元,輸出(output)150美元,分別是GPT-4o價格的30倍、15倍。
點評:在反映科學、數學、多語言、編碼的GPQA、AIME’24、MMMLU、SWE-Lancer基準測試上,GPT-4.5得分超過GPT-4o,但部分得分低於o3-mini。OpenAI更強調這個模型的“情商”,也就是模型的輸出更像人類在說話。價格上,GPT-4.5是個巨大、昂貴的模型,OpenAI因此還不確定是否長期在API使用該模型。
DeepSeek披露成本利潤,最高日賺346萬元
3月1日,在“開源周”五項代碼開源後,DeepSeek官方放出了最後一個彩蛋,首次披露DeepSeek-V3/R1推理系統的核心技術細節與商業化數據。根據官方數據,假定GPU租賃成本爲2美元/小時,DeepSeek計算出其每日總成本爲8.7萬美元,如果所有token都以DeepSeek-R1的價格計費,每日總收入將爲56.2萬美元(摺合人民幣約409萬元),成本利潤率達到545%。也就是說,理論上DeepSeek每日淨賺47. 5萬美元(摺合人民幣約346萬元)。但DeepSeek也提到,實際上他們並沒有這麼多收入,因爲V3的定價更低,同時收費服務只佔了一部分,面向用戶的網頁端和應用程序免費,另外夜間還會有折扣。
點評:在較高的利潤率背後,DeepSeek在計算優化上有很多嘗試,DeepSeek在本週陸續開源了5項代碼,在Github上詳細展開了DeepSeek-V3和R1模型背後的優化技術,通過這些闡述可以清晰瞭解團隊是如何精細地優化計算和通信,最大限度利用GPU能力的。
英偉達2025財年營收同比增長114%
美東時間2月26日,英偉達發佈2025財年第四季度財報(截至2025年1月26日),該季度英偉達營收393.31億美元,同比增長78%,淨利潤220.66億美元,同比增長72%。2025財年全年,英偉達營收、淨利潤分別爲1304.97億美元、728.8億美元,分別同比增長114%、145%。英偉達CEO黃仁勳表示,市場對Blackwell芯片的需求十分旺盛,英偉達已經實現Blackwell AI超級計算機的大規模生產,第一季度銷售額就達到數十億美元。
點評:從英偉達的最新財報看,市場上對AI芯片的需求仍然強勁。在財報發佈後的電話會議上,英偉達首席財務官表示,AI模型後訓練實際上會增加市場對AI芯片的需求。上週黃仁勳也迴應DeepSeek衝擊波稱,雖然有很多人認爲DeepSeek-R1出現意味着AI不再需要進行任何計算,但DeepSeek-R1發佈本質上利好AI市場,能加速AI被採用。
阿里巴巴開源萬相2.1視頻生成模型
2月25日晚,阿里巴巴宣佈全面開源旗下視頻生成模型萬相2.1模型。此次開源基於Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在Github、HuggingFace和魔搭社區下載體驗。
點評:DeepSeek開源DeepSeek-R1之後,開源潮流還在繼續涌動。目前,視頻生成大模型的技術路線遠不及文本大模型收斂,視頻生成模型開源之後有利於開發者研究。阿里也是國內大模型開源的主要貢獻者之一。
百度本月發佈文心大模型4.5 ,具備深度思考及原生多模態能力
2月28日,百度官方公衆號宣佈,將於3月16日發佈文心大模型4.5。百度官方介紹,文心大模型4.5在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。
點評:近期百度搜索、文庫、網盤、營銷等業務全面接入DeepSeek,當一家成立僅一年半的企業以開源大模型的顛覆性姿態直擊大模型與搜索市場腹地,作爲傳統搜索巨頭和國內大模型賽道先行者的百度,護城河正遭遇前所未有的滲透與挑戰,但這也倒逼它快速調整方向做出改變。此前百度董事長李彥宏透露文心大模型4.5將開源,有望進一步促進文心大模型的廣泛應用,並在更多場景中擴大其影響力,“但我想強調的是,無論開源閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值”。
騰訊混元發佈快思考模型Turbo S
2月27日,騰訊混元發佈自研的快思考模型Turbo S。不同於Deepseek R1、混元T1等慢思考模型,Turbo S吐字速度提升一倍。架構上,該模型採用Hybrid-Mamba-Transformer 融合模式。Turbo S未來將成爲騰訊混元系列衍生模型的核心基座。
點評:騰訊混元近期頻繁發佈新模型並更新模型能力,包括推出深度思考模型T1、快思考模型Turbo S,騰訊元寶近日還“迭代”了DeepSeek,通過加入混元的多模態理解能力,讓DeepSeek具備理解圖片的能力。在多個基準測試中,Turbo S得分部分超過GPT-4o和DeepSeek-V3。接下來幾個月內OpenAI將發佈GPT-5,混元還要繼續追趕OpenAI。
微信新增“元寶下載”入口
2月26日,部分用戶微信的“生活服務”一欄出現了“元寶下載”的入口。微信團隊表示,騰訊內部協調部署,在微信的“我”-“服務”-“生活服務”裡限時提供該入口。據瞭解,元寶搭載了滿血版DeepSeek-R1和混元深度思考模型T1。元寶近期宣傳力度有所增強,據數字化內容營銷平臺DataEye數據,2月18日至23日,元寶投放素材量5.5萬組,較此前6天增長了345.1%。
點評:藉着接入DeepSeek,騰訊近期加強了推廣騰訊元寶的力度。記者近日在朋友圈、騰訊視頻、bilibili都看到了騰訊元寶的廣告。強力推廣下,2月22日騰訊元寶超越豆包,升至蘋果中國區APP下載排行榜第二名。元寶用戶量增加之後,後續看點是如何讓用戶留存、如何探索商業化。
聯想發佈AI 端側部署DeepSeek的AI PC
2月25日,聯想推出首款端側部署DeepSeek的AI PC新品。據介紹,聯想AIPC 新品通過端側部署與蒸餾技術創新,在消費級設備上實現70億參數端側模型的運行。這使得用戶文檔的總結、翻譯、撰寫等操作無需調用雲端大模型即可完成,保障數據隱私與離線可用性。聯想moto AI手機、聯想AI平板電腦的DeepSeek端側個人大模型也將陸續發佈。
點評:此前AI助推聯想股價創歷史新高。聯想集團董事長楊元慶稱,DeepSeek爲加速人工智能平民化和應用落地提供了更加現實的路徑。尤其會驅動AI PC的發展,帶動換機的需求,加上Windows 10也已到了最後的階段,諸多因素都會帶動PC市場的增長。比較樂觀的情況下,聯想預計會有接近雙位數的增長。
AI圖像平臺LiblibAI獲數億元融資,巨人網絡參投
2月24日,AI圖像生成平臺LiblibAI-哩布哩布AI宣佈,該公司再獲數億元人民幣融資,巨人網絡爲本輪產業投資方。LiblibAI成立於2023年,在最近一年內已完成四輪融資。2024年7月,該公司剛披露了數億元融資動作。最新兩輪融資由渶策資本、順爲資本領投,明勢創投等老股東跟投,遠識資本繼續擔任財務顧問。金沙江創投主管合夥人朱嘯虎表示,金沙江創投作爲LiblibAI最早的投資人,見證了LiblibAI 在 AI 圖像生成領域的穩健佈局與快速發展。LiblibAI的投資機構還包括高榕創投和源碼資本。
點評:巨人網絡方面表示,LiblibAI在AI圖形創作賽道已經具有中國最大的Lora創作者社區生態,巨人網絡期待與Liblib社區建立合作,開創AI圖形與交互式內容應用創新賽道。公開資料顯示,LiblibAI致力於AI內容的創作和分享,目標是徹底改變設計師、畫師、自媒體創作者的原有創作方式。截至目前,其模型/圖像創作者已突破兩千萬,其用戶自主訓練的原創AI模型與工作流超50萬,累計生成圖片逾5億張。