AI早知道|谷歌開源多模態模型Gemma-3;字節上線AI音效生成模型

1.360智腦團隊成功復現Deepseek強化學習效果,發佈開源推理模型Light-R1-14B-DS。該模型在14B參數規模上實現強化學習突破,數學推理能力顯著提升,超越多數32B級別模型。

2.字節AI音效生成模型SeedFoley上線即夢,該模型通過先進的AI技術,實現視頻與音效的高度同步,用戶只需簡單操作即可爲視頻添加專業級音效。

3.谷歌Gemini 2.0 Flash全模態圖像生成功能正式上線,用戶可通過自然語言對話生成和編輯圖像,支持文本與圖像結合、對話式編輯、世界知識理解和文本渲染等亮點。

4.Domo AI 最近對其圖像到視頻(i2v)模型進行了重大升級,提升了模型的穩定性和生成速度,同時增強了對用戶提示詞的理解能力。新模型可更準確地將靜態圖像轉化爲流暢動畫,並支持多種風格轉換。

5.Remade AI 在 Hugging Face 平臺推出了8款基於 Wan2.1模型的開源特效 LoRA,這些特效模塊不僅能夠將靜態圖像轉化爲動態視頻,豐富了 AI 視頻創作的可能性。

6.Sesame公司推出最新語音合成模型CSM,採用Transformer多模態架構,可生成自然、富有情感的語音,聲音貼近真人。

想要了解更多AI 行業資訊以及ChatGPT和AI繪畫實戰案例,歡迎加入我們的「互聯網AI早讀課」知識星球!

在這個星球,你可以更加系統的學習AIGC相關知識:

1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;

2. ChatGPT和AI繪畫最直接變現案例;

3. 與200+行業先行者鏈接,積累你的專屬人脈資源;

4. 社羣保姆級一站式服務,包教包會包討論;

現在加入,立享99元早鳥價優惠,星球用戶每漲100人,價格上調100元,直到恢復499元原價!

這個風口抓不抓的住,就看你願不願意邁出第一步了!

越晚加入成本越貴!最後兩個名額又要漲價了!