李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型

近日,李飛飛等斯坦福大學和華盛頓大學研究人員以不到50美元的雲計算費用訓練了一個名叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提煉出來的,使用16個英偉達H100 GPU進行了26分鐘的訓練。