面壁智能發佈端側大模型MiniCPM 4.0

6月6日晚,面壁智能發佈端側大模型MiniCPM 4.0。該公司稱新模型通過自研CPM.cu推理框架,在極限場景下實現最高220倍提速,常規5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。