360智腦推出Light-IF系列模型

8月12日,360智腦團隊宣佈提出新的Light‑IF框架,以預覽‑自檢式推理和信息熵控制爲核心,提升模型在複雜指令上的遵循度。Light‑IF框架包括五個關鍵環節:難度感知指令生成、Zero-RL強化學習、推理模式提取與過濾、熵保持監督冷啓動、熵自適應正則強化學習。Light-IF-32B/14B/8B/4B/1.7B全系模型將陸續在Hugging Face開放。