字節Seed智能體模型UI-TARS-1.5開源
4月17日,字節跳動豆包大模型團隊(Seed)發佈並開源UI-TARS-1.5。據介紹,這是一款基於視覺-語言模型構建的開源多模態智能體,能夠在虛擬世界中高效執行各類任務。目前,UI-TARS-1.5已在7個典型的GUI圖形用戶界面評測基準中取得SOTA表現,並首次展現了其在遊戲中的長時推理能力和在開放空間中的交互能力。
相關資訊
- ▣ 百川智能開源全模態模型Omni-1.5上線,稱多項能力超越GPT-4o mini
- ▣ 智源發佈大模型評測榜:語言模型字節第一百度第二
- ▣ 接入豆包大模型 字節跳動首款AI智能體耳機來了!
- ▣ 智譜開源年第一彈:發佈首個能生成漢字的開源文生圖模型CogView4
- ▣ AI早知道|智譜AI推出AutoGLM智能體;字節跳動發佈語音合成模型
- ▣ 字節音樂大模型炸場!Seed-Music發佈,支持一鍵生成高質量歌曲
- ▣ Meta發佈LLAMA 3.1開源人工智能模型
- ▣ 字節跳動發佈豆包大模型 1.5 Pro,綜合性能超越GPT-4o
- ▣ Meta發佈LLAMA 3.1 405B開源人工智能模型
- ▣ IBM宣佈將更多人工智能模型開源
- ▣ AI早知道|谷歌開源多模態模型Gemma-3;字節上線AI音效生成模型
- ▣ 智譜開源清影CogVideoX模型
- ▣ 字節跳動或用華爲芯片訓練人工智能模型?
- ▣ 國泰君安:字節人形機器人迭代具身大模型 看好字節具身智能模型算法上的競爭
- ▣ 字節大模型同傳智能體,一出手就是媲美人類的同聲傳譯水平
- ▣ AI早知道|智譜AI開源新模型;Claude開放Artifacts 功能
- 智源大會開幕,全球最大智能模型“悟道2.0”發佈
- ▣ 智譜發佈首個生成漢字的開源文生圖模型CogView4
- ▣ 大模型給能源產業帶來什麼(能源與智能)
- ▣ 北京將建設全球“開源之都” 推動人工智能大模型開源開放
- 大模型已達上限?巨頭開“卷”AI智能體
- ▣ 智能體打開教育擁抱大模型的入口
- ▣ 協鑫能科:除算力資源租賃,還聚焦“數字能源大模型”等垂直場景大模型訓練和開發
- ▣ 智譜開源視頻生成模型CogVideoX
- ▣ 崑崙萬維開源數字智能體研發工具包AgentStudio
- ▣ 百川智能發佈全模態模型Baichuan-Omni-1.5,性能大幅超越GPT-4o-mini
- ▣ 智譜發佈首個支持生成漢字的開源文生圖模型CogView4
- ▣ 南自信息智能巡檢產品接入DeepSeek開源大模型
- ▣ 字節跳動豆包大模型團隊開源一項MoE架構優化技術