賽道Hyper | 海力士攜手英特爾轟擊英偉達帝國?

作者:周源/華爾街見聞

最近業界有消息稱,SK海力士有望與英特爾就HBM4(第六代)內存供應展開合作,這是否意味着英特爾開始正式走上AI加速卡市場競爭角鬥場?

在算力需求呈指數級增長的當下,內存與芯片的協同關係,已從傳統的硬件配套,演變爲決定AI系統競爭力的核心要素。

無論是大型數據中心的AI模型訓練,還是邊緣設備的實時推理,內存性能都成爲制約系統效率的關鍵變量,而HBM4與Jaguar Shores的結合,符合行業發展趨勢。

AI芯片的性能瓶頸,已從單純的計算能力,擴展到數據傳輸環節。

以Transformer架構的大語言模型爲例,訓練過程中參數更新產生的海量數據,需頻繁在內存與處理器間交互,傳統DDR內存的串行傳輸模式,導致數據等待時間佔比超過30%。

這種計算資源閒置現象在訓練千億參數模型時尤爲明顯,往往造成單卡日均有效計算時長不足。

HBM4通過2048-bit接口實現的並行數據傳輸,將內存帶寬提升至前代產品1.5倍+,這種架構革新直接解決了AI芯片“計算快、傳輸慢”的矛盾。

在圖像生成領域,採用HBM4內存的AI加速器,處理512x512分辨率圖像的生成速度,比使用HBM3快約40%;在自動駕駛算法的實時推理中,車輛傳感器採集的每秒30GB數據能通過HBM4實現無延遲傳輸,爲決策系統爭取到寶貴的反應時間。

更關鍵的是HBM4的物理層優化,採用了CoWoS封裝技術,將多個DRAM芯片垂直堆疊並通過硅通孔(TSV)互聯,數據傳輸路徑由此極大縮短。

這種物理結構的改進,配合優化後的緩存一致性協議,顯著降低了內存延遲,讓AI芯片在處理時序數據時的響應速度提升。

在金融高頻交易的AI預測模型中,這種低延遲特性可將數據處理響應時間壓縮至微秒級,爲交易決策提供更及時的支持。

對於SK海力士而言,此次合作是其HBM技術商業化的重要節點。

HBM4面臨三星、美光的激烈競爭。通過與英特爾綁定,SK海力士不僅能提前驗證HBM4在複雜AI場景下的適配性,還能借助英特爾龐大的服務器客戶資源,建立規模化生產優勢。

目前SK海力士在韓國利川的HBM4生產線已啓動二期擴建,預計2026年量產,總體產能將達到30萬片晶圓;目前還不清楚與英特爾的合作訂單,將佔多少比例的產能。

英特爾的需求,整體上看,應當更具戰略緊迫性。

在AI芯片市場,英偉達憑藉CUDA生態和H100/H200系列產品佔據70%+份額(數據來源:Mercury Research)。

Jaguar Shores作爲英特爾新一代AI加速器,亟需通過硬件差異化實現破局。

HBM4內存的引入,使Jaguar Shores在內存帶寬指標上首次達到行業領先水平,爲其切入雲服務商定製化AI服務器市場提供關鍵籌碼。

英特爾數據中心事業部已與微軟Azure達成初步協議,計劃在2026年部署搭載Jaguar Shores和HBM4的AI服務器集羣,用於支持大語言模型的分佈式訓練。

在內存市場,此次合作加劇了HBM領域的“三國殺”局面。

三星電子已宣佈將在2025年底前量產HBM4,採用了12層堆疊技術,比SK海力士多2層,宣稱帶寬可再提升10%;美光也計劃在2026年實現技術突破,重點優化HBM4的功耗表現,目標將能效比提升25%。

SK海力士與英特爾的綁定,可能促使三星加速與AMD的合作,雙方已在研發基於HBM4的GPU原型機;美光則與高通聯手,探索HBM4在移動AI芯片上的應用,試圖開闢新的市場空間。

這樣的競爭烈度,可能會推動HBM技術迭代週期從兩年縮短至一年內,2027年HBM5的研發可能提前啓動。

AI芯片市場的競爭維度正在發生變化。

英偉達的優勢在於完整的軟硬件生態,但隨着HBM4等通用技術的普及,其他廠商得以在硬件性能上縮小差距。

數據中心運營商已開始嘗試多廠商AI芯片混合部署方案,谷歌TPU(張量處理器:Tensor Processing Unit,定製AI加速卡,屬於ASIC類型)與英偉達GPU的混合集羣已在部分業務中應用。

英特爾若能通過Jaguar Shores+HBM4組合證明性價比優勢,有望打破英偉達在超大規模數據中心的壟斷局面。

目前,亞馬遜AWS已表示將對Jaguar Shores做爲期6個月的性能測試,測試內容涵蓋模型訓練速度、能耗比、兼容性等多項關鍵指標。

儘管HBM4能顯著提升AI芯片性能,但仍面臨發展瓶頸:其一,垂直堆疊帶來的散熱問題,HBM4芯片組工作時的熱密度達150W/cm²,超出傳統風冷散熱能力,英特爾爲此專門開發了浸沒式液冷方案,通過氟化液直接接觸芯片表面,散熱效率比冷板式液冷大幅提高。

其二,成本居高不下,單顆HBM4芯片的製造成本約爲HBM3E的1.3倍(數據來源:TrendForce),原因是因爲I/O數量從1024變爲2048,芯片設計複雜度加劇,晶圓體積變大,且基礎芯片變爲邏輯芯片,同時還採用了更先進的製程生產邏輯芯片。

對於英特爾而言,獲得HBM4只是第一步。

如何通過軟件優化(如開發專用內存調度算法)、散熱創新(如液冷一體化設計),將硬件性能轉化爲實際應用優勢,纔是決定Jaguar Shores市場成敗的關鍵,也是英特爾能否真正取得AI加速卡市場競爭門票的最好註腳。

英特爾軟件團隊已開發出基於動態內存分區的調度算法,可根據不同AI任務的內存需求自動分配帶寬資源,在測試中提升了BERT(Bidirectional Encoder Representations from Transformers)模型的訓練效率。

SK海力士同樣需要與更多芯片廠商合作,推動HBM4成爲行業標準,避免陷入“技術先進但生態孤立”困境。

目前,SK海力士已與臺積電達成合作,將HBM4集成到CoWoS封裝的參考設計中,降低其他芯片廠商的適配難度。

SK海力士與英特爾的HBM4合作,不僅關乎內存與芯片的性能提升,更預示着未來AI硬件競爭將從單一技術比拼,轉向生態構建與產業鏈整合的全方位較量。

這場合作的最終成效,將在未來2-3年AI芯片市場的洗牌中得到驗證,而其影響也將延伸至整個AI產業的技術路徑選擇與發展節奏。