微軟開源新版Phi-4:推理效率暴漲10倍,筆記本可運行

格隆匯7月10日|據AIGC開放社區,今天凌晨,微軟在官網開源了Phi-4家族的最新版本Phi-4-mini-flash-reasoning。mini-flash版延續了Phi-4家族參數小性能強的特點,是專門針對那些受算力、內存和延遲限制場景設計的,單個GPU可運行,適合筆記本、平板電腦等邊緣設備。與前一個版本相比,mini-flash使用了微軟自研的創新架構SambaY,推理效率暴漲了10倍,延遲平均降低了2—3倍,整體推理性能實現了大幅度提升。