☰

IBM發表可大幅減少記憶體用量的「小語言模型」 Granite 4.0

IBM日前發表其最新一代企業級「小語言模型」Granite 4.0，以創新的混合式架構 — 結合Mamba-2與 Transformer技術，實現前所未有的效能與效率。Granite 4.0 不僅大幅降低記憶體與硬體成本，更提供企業部署AI的安全性、可控性與彈性，爲臺灣各類型企業的AI應用落地提供強力支援。這一代模型優化了處理 Agentic 工作流程核心任務的能力，無論是獨立部署，或作爲大型推理系統中的高效模組，皆能發揮關鍵作用。

Granite 4.0 採用創新的 Mamba/Transformer 混合架構，突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度，讓 Granite 4.0 在處理複雜任務時，大幅減少記憶體的使用量達70%，推理速度卻加快二倍，同時支援更平價的 GPU包括家用硬體。這項突破對臺灣中小企業與開發者意味着高效能AI不再是高成本的同義詞，而是人人可及的技術資源。

Granite 4.0已在 IBM watsonx.ai 平臺正式上線，並同步支援 Dell Technologies (Dell Pro AI Studio 與 Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平臺；未來也將支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry。

Granite 4.0 提供多種模型規格，靈活應對不同場景；並預計於2025年底推出強化邏輯推理的Thinking 模型。

IBM 發表「中小企業友好」的AI 小語言模型 Granite 4.0，大幅降低記憶體的使用量達七成，推理速度加快2倍，同時支援更平價的GPU包括家用硬體。圖／IBM提供

IBM發表可大幅減少記憶體用量的「小語言模型」 Granite 4.0

相關資訊