AI早知道|ChatGPT免費開放高級語音模式;B站推出IndexTTS文本轉語音模型
1.字節跳動與中國和新加坡大學研究團隊聯合推出的PhotoDoodle,利用Flux.1模型重新定義圖像創作。該系統通過少量樣本學習藝術風格,精準執行編輯指令,極大地提高了創意表達的可能性。
2.B站推出的IndexTTS模型是基於XTTS和Tortoise的GPT風格文本轉語音系統,具備獨特的拼音糾正漢字發音能力和精準的停頓控制。
3.微軟開源了名爲“Magma”的多模態AI Agent基礎模型。Magma能夠跨越數字和物理世界,處理圖像、視頻和文本等多種數據類型,並具備心理預測功能,能夠更準確地理解人物或物體的意圖。
4.ChatGPT的高級語音模式正式向用戶免費開放。該模式基於GPT-4o mini模型,通過優化計算效率,性能已接近完整版GPT-4o。
5.DeepSeek在開源周最後一天發佈了Fire-flyer File system(3Fs)和Smallpond數據處理框架。3FS是一種高性能並行文件系統,專爲AI訓練和推理設計,支持大規模集羣的高吞吐量數據訪問,峰值讀取吞吐量達6.6 TiB/s。Smallpond基於3FS和DuckDB構建,支持高效數據處理,可擴展至PB級數據集。
6.ElevenLabs 最近推出了其最新的語音轉文本模型 Scribe v1,聲稱在多種語言中達到了最高的準確性。該模型支持99種語言,能夠在複雜音頻環境中準確區分多達32位不同說話者。
想要了解更多AI 行業資訊以及ChatGPT和AI繪畫實戰案例,歡迎加入我們的「互聯網AI早讀課」知識星球!
在這個星球,你可以更加系統的學習AIGC相關知識:
1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;
2. ChatGPT和AI繪畫最直接變現案例;
3. 與200+行業先行者鏈接,積累你的專屬人脈資源;
4. 社羣保姆級一站式服務,包教包會包討論;
現在加入,立享99元早鳥價優惠,星球用戶每漲100人,價格上調100元,直到恢復499元原價!
這個風口抓不抓的住,就看你願不願意邁出第一步了!
越晚加入成本越貴!最後兩個名額又要漲價了!