字節跳動發佈Seed LiveInterpret 2.0:中英互譯準確率超80%,延遲低至2-3秒

7月24日,字節跳動Seed團隊發佈端到端同聲傳譯模型Seed LiveInterpret 2.0,這是首個延遲和準確率接近人類水平的產品級中英語音同傳系統。該模型基於全雙工端到端語音生成理解框架,支持中英互譯,可實時處理多人語音輸入,像人類同傳譯員一樣“邊聽邊說”。其翻譯準確率在多人會議場景中超過70%,單人演講場景中超過80%;翻譯延遲低至2-3秒,較傳統系統降低超60%。此外,該模型還支持零樣本聲音復刻,能用說話人的音色特質實時“說出”外語,提升交流的自然度。Seed LiveInterpret 2.0技術報告已公佈,基於火山引擎對外開放,Ola Friend耳機也將在8月底接入該模型。