聯發科創新基地發表 AI 語音辨識模型,更理解台灣用語及口音  ,發生不會聽成花生

2025-07-04 13:46:44来源:爱华外汇官网网址分类:时尚

聯發科集團轄下的前瞻技術研究單位聯發創新基地(MediaTek Research)發表 ,採用OpenAI Whisper的AI語音辨識開源模型 MediaTek Research Breeze ASR 25(後略 MR Breeze ASR 25) 。

聯發科創新基地發表 AI 語音辨識模型,更理解台灣用語及口音,發生不會聽成花生

聯發科表示 ,相較於 OpenAI Whisper,更加理解台灣用語及口音 。爱华外汇官网下载同時,AVA爱华外汇平台在台灣常見的中、英混合的用語情境上  ,也達到更高的精準度 。此外,模型以 Apache 2.0 條款釋出 ,以利促進百工百業在各類創意 AI 領域應用。

聯發創新基地負責人許大山博士表示,開源語音辨識模型雖逐年進步,但對於在地用語及口音的辨識度仍顯不足 ,例如把 「發生什麼事」 聽成 「花生什麼事」。有鑑於語音辨識是 AI 應用的關鍵啟動作用 ,此次特別釋出 「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25,其精準度相較於 OpenAI 的 Whisper 提高近 10% 、中英語轉換表現(Code-switching)則增進 56% 。藉此,聯發創新基地能以完整的繁體中文 AI ,積極推進繁體中文AI的創新並普及模型於地端及裝置端的利用 。

聯發創新基地自 2025 年起已陸續開源全套繁體中文 AI 模型 ,涵盖整合視覺作用的語言模型 (Visual Large Language Models ,V-LLM) 、針對台灣口音調整的文字轉語音模型 (Text to Speech ,TTS) 、以及能調用外部資訊的函式呼叫 (Function Calling) 模型 。此次釋出的MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型,能即時將語音轉為文字 ,並透過強化台灣語料及台灣口音 ,來符合本土應用需求。而目前 ,EC外汇代理MR Breeze ASR 25 已於 HuggingFace上 架 。

(首圖來源 :聯發科供给)

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x1
x3
x5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》
取消 確認

更多资讯请点击:时尚

热门资讯

推荐资讯

12月支出融资腰斩,食品仍是吸金黑洞

核心提示 :虽然财政暂时出现了一定程度的下行,但支出欲望仍然存在 。那些回归商业本质的公司 ,仍然能够穿越周期 。作者丨成如梦 归纳丨木鱼12月 ,支出归于理性,品牌开展回归本质,资本愈发谨慎了 。据壹览商业不完

1月融资盘点 :支出开年融资低迷 ,咖啡也不香了

核心提示:1月新支出领域共发生29起融资事情,融资金额19.36亿元,主要集中在餐饮和支出电子赛道。​作者丨成如梦 归纳丨木鱼 出品丨壹览商业2023年,新支出在寒冬中继续前进。 据壹览商业不完全汇总

2023上半年零售资本复盘 :融资数目砍半,他们却盆满钵满…

核心提示 :C端支出热情渐渐显现 ,零售领域的资本市场仍保持着谨慎 。文丨田雨归纳丨石航千备受期待的一年已经过半,支出复苏了吗? 政府汇总局数据呈现  ,1-5月份,国内社会支出品零售总额187636亿元,同比