聯發科創新基地發表 AI 語音辨識模型,更理解台灣用語及口音 ,發生不會聽成花生

2025-07-04 06:00:38来源:爱华外汇官网网址分类:休闲

聯發科集團轄下的前瞻技術研究單位聯發創新基地(MediaTek Research)發表,採用OpenAI Whisper的AI語音辨識開源模型 MediaTek Research Breeze ASR 25(後略 MR Breeze ASR 25)。

聯發科創新基地發表 AI 語音辨識模型,更理解台灣用語及口音,發生不會聽成花生

聯發科表示,相較於 OpenAI Whisper,更加理解台灣用語及口音 。爱华外汇官网开户同時,AVA爱华外汇平台在台灣常見的中、英混合的用語情境上,也達到更高的精準度。此外,模型以 Apache 2.0 條款釋出 ,以利促進百工百業在各類創意 AI 領域應用 。

聯發創新基地負責人許大山博士表示 ,開源語音辨識模型雖逐年進步 ,但對於在地用語及口音的辨識度仍顯不足 ,例如把 「發生什麼事」 聽成 「花生什麼事」 。有鑑於語音辨識是 AI 應用的關鍵啟動作用,此次特別釋出 「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25 ,其精準度相較於 OpenAI 的 Whisper 提高近 10% 、中英語轉換表現(Code-switching)則增進 56%  。藉此,聯發創新基地能以完整的繁體中文 AI ,積極推進繁體中文AI的創新並普及模型於地端及裝置端的利用 。

聯發創新基地自 2025 年起已陸續開源全套繁體中文 AI 模型  ,涵盖整合視覺作用的語言模型 (Visual Large Language Models,V-LLM) 、針對台灣口音調整的文字轉語音模型 (Text to Speech ,TTS) 、以及能調用外部資訊的函式呼叫 (Function Calling) 模型 。此次釋出的MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型,能即時將語音轉為文字 ,並透過強化台灣語料及台灣口音 ,來符合本土應用需求 。而目前  ,富拓外汇平台MR Breeze ASR 25 已於 HuggingFace上 架 。

(首圖來源:聯發科供给)

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x1
x3
x5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》
取消 確認

更多资讯请点击:休闲

热门资讯

推荐资讯

12月金额同比下降80% ,2023年能否迎来反弹?

核心提示 :拉面「陈香贵」、泰餐连锁「耀华力」 、滋补品牌「官栈」、大码女装品牌「BloomChic』和宠物医疗集团「新瑞鹏」获得融资 。文 | Sober据新支出Daily不完全汇总 ,2022年12月新支

特斯拉 Robotaxi 傳最初僅 10 輛上路 、行車範圍受限

眾人期待已久的特斯拉Tesla)德州奧斯汀自駕計程車服務robotaxi)即將於6月22日上線 ,但據傳一開始只有約十輛車投入運作 ,初始規模不大。googletag.cmd.push(function(

又有一批新获融资品牌要拓店了 :「王子森林」年内拓店百家 、「好运椰」布局全国市场……

核心提示 :健身私教综合服务商「乐途技术」以合伙人裂变方法开拓线下门店;主打新鲜现制的鲜酿活菌酸奶连锁品牌「王子森林」方向年内开出百家门店等 。政府汇总局数据呈现,1-3月份 ,社会支出品零售总额11492