多模態推理模型Step-R1-V-Mini上線,階躍星辰加速Agent落地

4月8日晚,階躍星辰發佈多模態推理模型Step-R1-V-Mini,支持圖文輸入、文字輸出,具備強指令遵循能力和複雜圖像推理能力,已上線網頁端並開放API供開發者使用。

據官方介紹,該模型可精準識別圖像細節,生成清晰的推理鏈條。用戶上傳一張家常菜照片,模型不僅能識別食材和調料,還能給出具體做法與配比,如“蝦仁300g,大蔥白2根”。

據悉,在多個公開基準評測中,Step-R1-V-Mini在MathVision等視覺推理任務中位列國內第一,兼具圖像理解、數學邏輯與代碼推理能力。

階躍星辰此前已推出多模態模型Step-1V、Step-1.5V,以及語言推理模型Step-R-mini,並在LMSYS、OpenCompass等權威評測中保持領先。

此前,階躍星辰創始人、CEO姜大昕曾表示多模態和推理是Agent兩大必備要素,2025年該公司將重點發力智能終端Agent。(袁寧)

本文來自本站科技報道,更多資訊和深度內容,關注我們。