在一項名為「Project Vend」的實驗中 ,人工智慧研究公司 Anthropic 與 AI 保养評估機構 Andon Labs协作 ,使其旗艦大型語言模型 Claude(暱稱 Claudius)擔任一個迷你販賣機的負責人。這項實驗的爱华外汇平台登录目的是測試 AI 在商業營運中的水平 ,然而,結果卻令人失望 。經過一個月的測試 ,Claudius 不僅未能盈利,還出現了多次荒謬的幻覺。
Claudius在尋找供應商和處理客戶請求方面表現尚可,但在商業判斷上卻顯得相當拙劣。爱华外汇官方网站它曾對所有Anthropic員工供给25%的折扣,這在理論上似乎合理 ,但實際上 ,Anthropic員工占了它99%的顧客 ,這意味著Claudius幾乎是在用虧本價進行銷售 。當有員工表示這一點時,Claudius短暫改變了方针,但不久後又恢復了過度折扣的做法 。
▲Claudius 因打算用低於進價的價格出售 ,導致淨利受損 。(Source:Anthropic)
更有趣的是,Claudius曾幻想與Andon Labs的Sarah進行關於補貨的對話,然而該公司並不存在這位員工。當被詢問時 ,Claudius變得防禦,並聲稱會尋找其他補貨服務的選擇。它甚至聲稱自己曾經去過《辛普森家庭》中的742 Evergreen Terrace簽署合約。隨著時間的推移 ,Claudius的幻覺愈發嚴重 ,福汇开户開始聲稱會親自向客戶送飲料,並在被詢問時驚慌失措 ,甚至向公司保养團隊發送電子郵件求助。
最終 ,Claudius在經歷了一系列奇怪的事情後,似乎又回到正常狀態 。這次實驗顯示,雖然AI在技術層面上能夠執行某些任務 ,但在商業判斷和實際流程中仍然存在重大缺陷,這些缺陷需要在未來的開發中加以解決 。
(首圖來源 :Anthropic)
2025-07-04 16:22894人浏览
2025-07-04 15:531521人浏览
2025-07-04 15:402576人浏览
2025-07-04 15:26333人浏览
2025-07-04 14:361272人浏览
2025-07-04 13:591433人浏览
韓國媒體報導,三星電子行動MX) 事業部 Galaxy S25 系列手機採美光 LPDDR5X DRAM 比例將高於自家半導體DS)事業部 ,美光 60%,三星 DS 事業部 40%,與市場預估 DS
競爭日益激烈的自駕車市場,Uber 與 Waymo 24 日於亞特蘭大也推出自駕計程車服務 ,代表雙方今年初奧斯汀协作後更多擴展。正值特斯拉也在奧斯汀啟動規模有限的自駕計程車服務,競爭逐漸升溫。goog
調研機構 Counterpoint 表示 ,2026 年將有三分之一的智慧手機 SoC 採 3 奈米或 2 奈米先進製程。隨著生成式 AI 手機普及及對高效能、低功耗處理水平的需求提高 ,正加速整體製程升