破除 LLM 無法「從經驗學習」限制,MIT 開發持續學習的 SEAL 模型

2025-07-04 13:07:33来源:ava爱华外汇官网分类:综合

為了解決當前大型語言模型(LLM)完全不具備「從經驗學習」水平,麻省理工學院(MIT)的研究人員設計出名為「自適應語言模型」(Self Adapting Language Models ,SEAL),讓 LLM 根據有用新資訊自行調整參數 ,爱华外汇官方网站持續改進表現 。 

研究人員表示 ,當前AI推理雖然能推理出更好的解答 ,但這些推理過程對模型的長期水平並沒有實質的幫助。相比之下,SEAL 能產出新見解,並將其納入模型自身的AVA外汇平台MT4下载權重或參數中 ,這就好像人類學生透過寫筆記與複習來增強學習效率的方法一樣  。

破除 LLM 無法「從經驗學習」限制,MIT 開發持續學習的 SEAL 模型

系統接著會利用這些資料替换模型  ,並測試新模型回答問題的水平  。最終,這個過程會產生一個「強化學習」訊號 ,用來引導模型朝向能提高整體水平、並促進持續學習的方向進行調整。

研究員用 Meta Llama 、阿里巴巴 Qwen 測試 ,也適用更大型模型。團隊並將 SEAL 用於一般文字任務,以及專門評估 AI 模型解決抽象推理問題水平的 ARC 基準測試 ,發現 SEAL 讓這些模型初始訓練完後也繼續學習。

值得注意的是 ,SEAL 專案觸及 AI 領域关键主題 ,如何讓 AI 自行判斷該學什麼 ,將來有助 AI 模型更個人化 。不過 SEAL 還不是讓 AI 無限進步的方法,因為測試曾出現所謂「災難性遺忘」現象 ,也就是當模型吸收新資訊後 ,使舊知識消失。

此外,SEAL 需要十分密集的運算,研究員難以有效安排新學習週期。為了解決這個問題,AVA外汇开户或許 LLM 也可像人類需要「睡眠期」,以便讓它有效融合新舊資訊。

不論如何,這項研究邁出朝「讓人工智慧模型具備持續學習水平」的關鍵一步  ,SEAL 持續最佳化後,人們有望打造更能吸收新資訊 、理解利用者興趣與偏好的聊天機器人與其他 AI 软件。

  • This AI Model Never Stops Learning

(首圖來源 :shutterstock)

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x1
x3
x5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》
取消 確認

更多资讯请点击:综合

热门资讯

推荐资讯

川普課高關稅保護本土產業,部分美國工廠卻叫苦

美國總統川普自今年 1 月重返白宮以來  ,對進口鋼鐵和鋁課徵關稅稅率 25%  ,隨後又倍增達到 50% ,這給一些美國業者帶來營運壓力 。googletag.cmd.push(function() { goo

中金唯品会奥特莱斯REIT收到上交所反馈意见

核心提示 :5月26日,上交所呈现中金唯品会奥特莱斯REITs情形替换为 “已反馈”,反馈涉及运营、估值 、运维等多方面难题 ,需三十个工作日内答复。5月26日,上海证券交易所数据呈现,中金唯品会奥特莱斯封

华夏首创奥莱REIT :询价区间2.464元/份

核心提示 :华夏首创奥莱REIT公布,本次询价区间确定为2.464元/份-2.591元/份 ,询价期间为8月2日9:00-15:00,预计发售8亿份,初始方针配售6亿份。7月30日,华夏首创奥特莱斯封闭式