基於阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首
觀點網訊:7月3日,Together.ai與Agentica合作開源創新AI代理框架DeepSWE,該框架基於阿里巴巴新近開源的Qwen3-32B模型,完全通過強化學習訓練開發,旨在提升人工智能代理的性能和效率。
DeepSWE在SWE-Bench-Verified測試中表現突出,Pass@1準確率達42.2%(16次運行平均),使用混合測試時擴展(TTS)後躍升至59%,超越所有開源代理框架位居榜首。
免責聲明:本文內容與數據由觀點根據公開信息整理,不構成投資建議,使用前請覈實。
本文源自:觀點網
相關資訊
- ▣ 阿里(09988)開源新版Qwen3模型 霸榜文本表徵
- ▣ 超越GPT4.1!阿里開源最強AI編程模型Qwen3-Coder
- ▣ 阿里開源通義千問最新的編程大模型Qwen3-Coder
- ▣ 阿里通義千問重磅升級 Qwen3-235B-Instruct登頂開源大模型
- ▣ 阿里開源通義千問AI編程大模型Qwen3-Coder
- ▣ 三個Agent頂個GPT-4,基於開源小模型的那種|中大阿里聯合出品
- ▣ 阿里通義千問大模型登頂全球開源社區榜首
- ▣ AI早知道|阿里開源全新多模態模型 Qwen2.5-VL-32B;DeepSeek-V3模型發佈
- ▣ AI早知道|阿里新發布Qwen3-4B模型;小紅書發佈開源模型dots.vlm1
- ▣ AI早知道|阿里開源大模型QwQ-32B;Grok免費開放語音模式
- ▣ 阿里巴巴開源新一代通義千問模型Qwen3
- ▣ 阿里萬相大模型登上全球開源榜首
- ▣ 賽道Hyper | 阿里開源編程模型Qwen3-Coder-Flash
- ▣ AI早知道|阿里通義千問登頂全球開源模型榜首;首款專爲犬類設計的AI文本轉語音模型
- 阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
- ▣ 阿里發佈並開源推理模型通義千問QwQ-32B
- ▣ 通義千問最新AI編程大模型Qwen3-Coder正式開源
- ▣ 阿里雲通義千問Qwen3旗艦版模型宣佈更新 性能超DeepSeek-V3等頂級開源模型
- ▣ 阿里開源自主搜索AI Agent
- ▣ 李開復談阿里Qwen3: 開源模型進一步讓大模型價格接近普惠點
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 智源最新模型評測:百度文心大模型4.0登頂閉源榜
- ▣ 阿里雲開源視頻基礎模型
- ▣ 阿里千問衍生模型數量破10萬 穩居全球最大開源模型榜首
- ▣ 北京開源大模型Kimi K2登頂全球榜單
- ▣ 阿里AI四連發 視頻模型Wan2.2開源
- ▣ 微軟開源多模態AI Agent
- ▣ 阿里國際發佈最新開源多模態模型Ovis
- ▣ 阿里雲開源從模型到工具的AI全棧技術