小米開源聲音理解大模型MiDashengLM-7B
財聯社8月4日電,小米自研聲音理解大模型MiDashengLM-7B今日正式發佈,並全量開源。據小米官方介紹,MiDashengLM-7B速度精度上實現雙突破:單樣本首Token延遲僅爲同類模型1/4、同顯存下併發超20倍,在22個公開評測集上刷新多模態大模型最好成績(SOTA)。
相關資訊
- ▣ 小米自研聲音理解大模型MiDashengLM-7B正式發佈並開源
- 小米聲音理解大模型MiDashengLM-7B 全面開源
- ▣ 小米發佈並開源MiDashengLM-7B多模態大模型
- ▣ 第一個100%開源的MoE大模型,7B的參數,1B的推理成本
- ▣ 摩爾線程正式開源音頻理解大模型MooER
- ▣ 崑崙萬維開源7B和32B最強數學代碼推理模型
- ▣ 周鴻禕自稱開源信徒:宣佈開源360智腦7B模型
- ▣ Meta無限長文本大模型來了:參數僅7B,已開源
- ▣ AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳
- ▣ 華爲宣佈開源盤古7B稠密和72B混合專家模型
- ▣ 宣佈首個推理大模型開源 小米集團今日盤中漲6.01%
- ▣ 阿里雲通義開源過程獎勵PRM模型,7B尺寸比GPT-4o更能發現推理錯誤
- ▣ 趣丸科技開源語音大模型MaskGCT
- ▣ AI早知道|騰訊推全球首個語音指揮FPS AI ;摩爾線程開源音頻理解大模型
- ▣ 將多模態大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B
- 小米首個推理大模型MiMo開源 稱比OpenAI、阿里Qwen強
- ▣ AI早知道|小米小愛大模型免費全量升級;Mistral聯合英偉達開源12B小模型
- ▣ 周鴻禕透露將開源360智腦7B模型,支持50萬字長文本輸入
- ▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
- DeepSeek開源其結合電腦視覺的多模態人工智慧模型「Janus-Pro-7B」
- ▣ 無問芯穹發佈首個端側全模態理解開源模型
- ▣ 智源研究院宣佈開源超長視頻理解模型Video-XL-2
- ▣ 崑崙萬維開源推理大模型Skywork MindLink
- ▣ 騰訊混元0.5B、1.8B、4B、7B模型發佈
- ▣ 快手上線多模態大模型Kwai Keye-VL 理解力爆表、技術細節全開源
- ▣ AI早知道|Kimi開源音頻基礎模型;階躍星辰開源圖像編輯模型
- ▣ Hugging Face開源小參數模型SmolLM3:雙模式推理+128K上下文
- ▣ MiniMax開源首個推理模型M1
- ▣ AI早知道|阿里開源大模型QwQ-32B;Grok免費開放語音模式