聯發科創新基地發表 AI 語音辨識模型 ,更理解台灣用語及口音,發生不會聽成花生

2025-07-04 12:28:54来源:爱华avatrade外汇官方分类:焦点

聯發科集團轄下的前瞻技術研究單位聯發創新基地(MediaTek Research)發表 ,採用OpenAI Whisper的AI語音辨識開源模型 MediaTek Research Breeze ASR 25(後略 MR Breeze ASR 25)。

聯發科創新基地發表 AI 語音辨識模型,更理解台灣用語及口音,發生不會聽成花生

聯發科表示,相較於 OpenAI Whisper,更加理解台灣用語及口音。爱华外汇官网同時,AVA外汇平台MT4下载在台灣常見的中、英混合的用語情境上 ,也達到更高的精準度 。此外,模型以 Apache 2.0 條款釋出,以利促進百工百業在各類創意 AI 領域應用 。

聯發創新基地負責人許大山博士表示 ,開源語音辨識模型雖逐年進步 ,但對於在地用語及口音的辨識度仍顯不足  ,例如把 「發生什麼事」 聽成 「花生什麼事」。有鑑於語音辨識是 AI 應用的關鍵啟動作用 ,此次特別釋出 「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25,其精準度相較於 OpenAI 的 Whisper 提高近 10% 、中英語轉換表現(Code-switching)則增進 56%。藉此,聯發創新基地能以完整的繁體中文 AI  ,積極推進繁體中文AI的創新並普及模型於地端及裝置端的利用。

聯發創新基地自 2025 年起已陸續開源全套繁體中文 AI 模型 ,涵盖整合視覺作用的語言模型 (Visual Large Language Models,V-LLM)、針對台灣口音調整的文字轉語音模型 (Text to Speech ,TTS)、以及能調用外部資訊的函式呼叫 (Function Calling) 模型。此次釋出的MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型,能即時將語音轉為文字,並透過強化台灣語料及台灣口音 ,來符合本土應用需求。而目前 ,XM外汇平台MR Breeze ASR 25 已於 HuggingFace上 架。

(首圖來源 :聯發科供给)

想請我們喝幾杯咖啡 ?

每杯咖啡 65 元

x1
x3
x5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》
取消 確認

更多资讯请点击:焦点

热门资讯

推荐资讯

上交所发文:2022年以来实现房地产融资总额1975亿元

核心提示  :2022年以来,主动对接核心民企 ,供给个性化融资服务,着力处理难点 ,拥护民企发行公司债券融资234亿元,实现房地产融资总额1975亿元。12月9日,上交所发文表示,2022年以来,主动对接核

年輕恆星周圍的氣體揭示行星形成的关键線索

天文學家近來對行星形成研究取得重大進展 ,美國威斯康辛大學麥迪遜分校領導的國際研究,利用阿塔卡瑪大型毫米及次毫米波陣列ALMA),最精確測量 30 顆年輕恆星周圍旋轉的氣體及質量隨時間的變化 ,成功繪製盤

失智症新藥評估是否納健保 ,邱泰源:循 HTA 程序進行

衛福部今年核准 2 款專門治療早期阿茲海默症新藥,今天將在亞東醫院展開第一針施打。對於是否年底納入健保給付,衛福部長邱泰源今天表示 ,健保署會循 HTA醫療技术評估)評估程序,先做專業評估,再做財務影響