歐洲版OpenAI Mistral塌房:蒸餾自DeepSeek

8月14日,被譽爲歐洲版OpenAI的Mistral公司被曝出醜聞。一位離職女員工Susan Zhang羣發郵件,指控Mistral最新模型疑似直接蒸餾自DeepSeek,卻對外包裝成強化學習(RL)成功案例,並刻意歪曲基準測試結果。

此前,推特博主Sam Peach通過分析模型輸出中過度使用的詞彙模式(Slop),發現Mistral-small-3.2與DeepSeek-v3之間存在高度相似性,很可能是蒸餾的結果。Mistral的問題在於可能隱藏了這部分事實,假裝自家模型的強化學習有效,這不僅歪曲了基準測試結果,而且誤導公衆。Mistral官方目前還沒有迴應。

Mistral由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample與Timothée Lacroix聯合創立於2023年,總部位於法國巴黎。Mistral一直走開源路線,推出的模型包括輕量級模型Mistral Small和主打編程的Mistral Code等。

Mistral在多語言處理和推理能力方面具備競爭力,在大模型市場中佔據獨特地位。Mistral還推出了自家聊天機器人LeChat,對標ChatGPT。Mistral估值已達100億美元,正在籌集新一輪10億美元融資。