☰

OpenAI發佈語音模型GPT-realtime 能夠生成更加自然流暢的語音

觀點網訊：8月29日消息，OpenAI發佈語音模型GPT-realtime。

據介紹，GPT-realtime是一個專用於語音AIAgent的多模態模型，能夠生成更加自然流暢的語音，完美模仿人類豐富多樣的語調、情感以及語速，支持圖像理解並將其與語音或文本對話相結合使用，非常適用於客服、教育、金融、醫療等領域打造語音智能體。

GPT-realtime還新增了Marin與Cedar兩種極具特色的語音，同時對原有的8種語音也進行了全面升級。與傳統純語音模型不同的是，GPT-realtime還具備智力、推理和理解能力，例如，能夠敏銳捕捉笑聲等非語言信號，在句子中間自如地切換語言，並根據場景需求靈活調整語氣。

免責聲明：本文內容與數據由觀點根據公開信息整理，不構成投資建議，使用前請覈實。

相關資訊

▣ GPT-4o模仿人聲說“不”，無意的語音生成仍是模型弱點
▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
▣ OpenAI CTO：Sora今年將發佈，會添加語音功能
▣ OpenAI推遲發佈ChatGPT的語音助手功能
▣ OpenAI推遲發佈ChatGPT的語音助理功能
▣ OpenAI推出語音克隆AI模型
▣ OpenAI 發佈高級語音模式更新更加個性化並且更少打擾用戶
▣ OpenAI推遲發佈ChatGPT語音助手功能
▣ OpenAI開發者大會派禮包：大幅降低模型成本，AI語音加持App，小模型“蹭”大模型性能
▣ Open AI發佈實時響應的GPT-4o AI模型國產手機AI語音助手能趕上嗎？
▣ OpenAI首次展示語音生成模型Voice Engine：可複製原聲
▣ OpenAI 更新了他們最新的語音功能
OpenAI發佈GPT-Realtime，夸克研發AI產品“造點” | 藍媒GPT
▣ 成本最高降90% 百度發佈端到端語音語言大模型
▣ OpenAI發佈語音模型Voice Engine，出於安全考慮僅小範圍試用
對話更自然、更有溫度 OpenAI推出大型自然語言模型GPT-4.5
▣ ElevenLabs 發佈文本轉語音 Turbo 2.5 AI 模型
▣ Google Gemini稱OpenAI的GPT-4是最先進的大語言模型
▣ OpenAI推出通用大語言模型GPT-4.5：情商更高，幻覺更少
▣ OpenAI推遲ChatGPT新語音模式
▣ OpenAI發佈開放權重語言模型
▣ 浙江君同智能申請基於條件擴散模型的語音轉換對抗音頻生成專利，提高語音轉換對抗音頻生成效率效果
▣ OpenAI推出GPT-4的語音模式，今年秋季將向所有付費用戶開放
OpenAI推模擬真人語音技術
▣ OpenAI宣佈發佈GPT-4 Turbo模型
▣ OpenAI發佈實時API AI實時語音時代加速到來
▣ OpenAI發佈GPT-Realtime，AI Agent進入超逼真對話時代
▣ OpenAI用26分鐘再次震撼世界！新模型GPT-4o語音水平接近人類，科幻正在成真
▣ Anthropic發佈“GPT-4 對手”Claude 2大語言模型

DMCA | PRIVACY | s@bg3.co