OpenAI發佈語音模型GPT-realtime 能夠生成更加自然流暢的語音
觀點網訊:8月29日消息,OpenAI發佈語音模型GPT-realtime。
據介紹,GPT-realtime是一個專用於語音AIAgent的多模態模型,能夠生成更加自然流暢的語音,完美模仿人類豐富多樣的語調、情感以及語速,支持圖像理解並將其與語音或文本對話相結合使用,非常適用於客服、教育、金融、醫療等領域打造語音智能體。
GPT-realtime還新增了Marin與Cedar兩種極具特色的語音,同時對原有的8種語音也進行了全面升級。與傳統純語音模型不同的是,GPT-realtime還具備智力、推理和理解能力,例如,能夠敏銳捕捉笑聲等非語言信號,在句子中間自如地切換語言,並根據場景需求靈活調整語氣。
免責聲明:本文內容與數據由觀點根據公開信息整理,不構成投資建議,使用前請覈實。