OpenAI發佈GPT-Realtime,AI Agent進入超逼真對話時代

據華爾街見聞,多模態模型,能夠生成更加自然流暢的語音,完美模仿人類豐富多樣的語調、情感以及OpenAI發佈語音模型GPT-realtime。GPT-realtime是一個專用於語音AIAgent的語速,支持圖像理解並將其與語音或文本對話相結合使用,非常適用於客服、教育、金融、醫療等領域打造語音智能體。GPT-realtime還新增了Marin與Cedar兩種極具特色的語音,同時對原有的8種語音也進行了全面升級。