快訊|華爲昇騰適配階躍星辰多模態開源模型
3月10日消息,魔樂社區(Modelers)宣佈已上架由階躍星辰自研的 Step-Video 視頻生成和 Step-Audio 語音模型兩款開源多模態大模型,並基於華爲昇騰 CANN 異構計算架構和昇騰服務器,完成了對模型的適配。開發者和企業用戶在魔樂社區中可以直接下載並體驗。
據瞭解,Step-Video-T2V 是目前全球參數量最大的開源視頻生成模型,達到300億參數。可直接生成204幀、540P分辨率的高質量視頻。根據階躍星辰此前公佈評測結果,Step-Video-T2V 在指令遵循、運動平滑性、物理合理性、美感度等方面的表現均顯著超過市面上既有的效果最佳的開源視頻模型;而 Step-Audio 是行業內首款產品級開源語音交互大模型,能生成多種情感、方言、語言、唱腔及個性化風格的語音。階躍星辰在不久前的生態開放日上透露,3月份還將開源圖生視頻模型。
據悉,魔樂社區由天翼雲與華爲聯合打造,面向 AI 開發者與技術愛好者,提供模型、數據集、開發工具鏈與應用的一站式託管與展示服務。(定西)
本文來自本站科技報道,更多資訊和深度內容,關注我們。