《半導體》專爲臺灣設計的AI語音模型!聯發科端MR Breeze ASR 25
此外,該模型以Apache 2.0條款開源,旨在促進各行各業在創意AI領域的應用。 聯發創新基地負責人許大山博士表示,儘管開源語音辨識模型逐年進步,但對於在地用語和口音的辨識仍存在不足之處。例如,語音辨 識系統可能會將「發生什麼事」聽成「花生什麼事」。
他指出,語音辨識是AI應用的關鍵啓動功能,因此此次特別釋出「聽得懂在地語言」的ASR模型MR Breeze ASR 25。該模型的精準度較OpenAI Whisper提升了近10%,而在中英語轉換(Code-switching)表現方面,則增進了56%。
這一舉措使聯發創新基地能夠推進繁體中文AI的創新,並普及該模型在地端及裝置端的應用。 聯發創新基地自2025年起,已逐步開源全套繁體中文AI模型,包括整合視覺功能的語言模型(Visual Large Language Models, V-LLM)、針對臺灣口音調整的文字轉語音模型(Text to Speech, TTS)以及能調用外部資訊的函式呼叫(Function Calling)模型。
此次釋出的MR Breeze ASR 25是MR Breeze系列的第二代語音辨識開源模型,能即時將語音轉換爲文字,並強化臺灣語料及臺灣口音,以滿足本土應用需求。MR Breeze ASR 25目前已在HuggingFace上架。