基於阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首
觀點網訊:7月3日,Together.ai與Agentica合作開源創新AI代理框架DeepSWE,該框架基於阿里巴巴新近開源的Qwen3-32B模型,完全通過強化學習訓練開發,旨在提升人工智能代理的性能和效率。
DeepSWE在SWE-Bench-Verified測試中表現突出,Pass@1準確率達42.2%(16次運行平均),使用混合測試時擴展(TTS)後躍升至59%,超越所有開源代理框架位居榜首。
免責聲明:本文內容與數據由觀點根據公開信息整理,不構成投資建議,使用前請覈實。
本文源自:觀點網
相關資訊
- ▣ 阿里(09988)開源新版Qwen3模型 霸榜文本表徵
- ▣ 三個Agent頂個GPT-4,基於開源小模型的那種|中大阿里聯合出品
- ▣ AI早知道|阿里開源全新多模態模型 Qwen2.5-VL-32B;DeepSeek-V3模型發佈
- ▣ 阿里通義千問大模型登頂全球開源社區榜首
- ▣ 阿里巴巴開源新一代通義千問模型Qwen3
- ▣ AI早知道|阿里開源大模型QwQ-32B;Grok免費開放語音模式
- ▣ 阿里萬相大模型登上全球開源榜首
- ▣ AI早知道|阿里通義千問登頂全球開源模型榜首;首款專爲犬類設計的AI文本轉語音模型
- 阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
- ▣ 阿里發佈並開源推理模型通義千問QwQ-32B
- ▣ 阿里開源自主搜索AI Agent
- ▣ 李開復談阿里Qwen3: 開源模型進一步讓大模型價格接近普惠點
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 智源最新模型評測:百度文心大模型4.0登頂閉源榜
- ▣ 阿里雲開源視頻基礎模型
- ▣ 阿里千問衍生模型數量破10萬 穩居全球最大開源模型榜首
- ▣ 微軟開源多模態AI Agent
- ▣ 阿里國際發佈最新開源多模態模型Ovis
- ▣ 微軟開源多模態AI Agent—Magma
- ▣ 阿里雲開源從模型到工具的AI全棧技術
- ▣ 智源最新模型評測:百度文心大模型4.0登頂閉源榜 超GPT-4o等
- ▣ 阿里新模型 Qwen3將亮相
- ▣ 阿里通義千問開源首個MoE模型
- 不只秒回答案…登頂全球最強開源模型 阿里「千問3」有多強?
- ▣ 恆生互聯網ETF(159688)漲超2%,阿里萬相大模型登上全球開源榜首
- ▣ 阿里雲魔搭社區首發階躍星辰最新開源兩款多模態模型,已上架超4萬個開源模型
- 阿里推開源AI模型 用影片解讀情緒
- ▣ Meta開源複雜虛擬人動作模型!用於控制基於虛擬物理的人形Agent
- ▣ Alibaba 新開源模型 QwQ-32B:以更小算力匹敵 DeepSeek-R1