聯發科集團轄下的前瞻技術研究單位聯發創新基地(MediaTek Research)發表 ,採用OpenAI Whisper的AI語音辨識開源模型 MediaTek Research Breeze ASR 25(後略 MR Breeze ASR 25)。
聯發科表示,相較於 OpenAI Whisper,更加理解台灣用語及口音。AvaTrade爱华外汇开户同時,爱华外汇官方网站在台灣常見的中、英混合的用語情境上 ,也達到更高的精準度 。此外 ,模型以 Apache 2.0 條款釋出,以利促進百工百業在各類創意 AI 領域應用。
聯發創新基地負責人許大山博士表示,開源語音辨識模型雖逐年進步,但對於在地用語及口音的辨識度仍顯不足,例如把 「發生什麼事」 聽成 「花生什麼事」 。有鑑於語音辨識是 AI 應用的關鍵啟動作用 ,此次特別釋出 「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25 ,其精準度相較於 OpenAI 的 Whisper 提高近 10%、中英語轉換表現(Code-switching)則增進 56% 。藉此,聯發創新基地能以完整的繁體中文 AI ,積極推進繁體中文AI的創新並普及模型於地端及裝置端的利用 。
聯發創新基地自 2025 年起已陸續開源全套繁體中文 AI 模型,涵盖整合視覺作用的語言模型 (Visual Large Language Models,V-LLM) 、針對台灣口音調整的文字轉語音模型 (Text to Speech ,TTS)、以及能調用外部資訊的函式呼叫 (Function Calling) 模型。此次釋出的MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型 ,能即時將語音轉為文字 ,並透過強化台灣語料及台灣口音 ,來符合本土應用需求 。而目前,FXTM富拓外汇代理MR Breeze ASR 25 已於 HuggingFace上 架 。
(首圖來源:聯發科供给)
2025-07-04 16:511251人浏览
2025-07-04 16:29868人浏览
2025-07-04 16:271666人浏览
2025-07-04 15:012137人浏览
2025-07-04 14:452945人浏览
2025-07-04 14:331857人浏览
美國食品及藥物运维局FDA)18 日通过首款每年只需注射兩次的 HIV 藥物。高風險人群現可每六個月注射一次 lenacapavir商品名 Yeztugo),無需每日服藥,對人類與 HIV 的戰役具重
西門子數位化工業軟體於 2025 年設計自動化大會DAC 2025)上公布推出適用於 EDA 設計流程的 AI 強化软件組,並在大會期間展示 AI 技術如何助力 EDA 產業提高生產力、加快產品上市速
面對 Windows 10 系統將在今年 10 月 14 日終止官方支援 ,剩下不到 4 個月的時間了 ,仍舊利用 Windows 10 電腦的用戶和企業做好下一階段的準備嗎 ?googletag.cmd.