AI店長爆出「5大致命傷」虧爆了! Anthropic公開實驗失敗內幕

▲透過爲期一個月的試驗性實驗揭秘AI開店「5大致命傷」,Anthropic看見新曙光。(圖/翻攝自Anthropic.com)

記者陳致平/綜合報導

你是否曾幻想過,AI 不只會聊天,還能成爲精明的店長?美國 AI 新創公司 Anthropic 最近進行了一項名爲「販售計劃」(Project Vend)的創新實驗,他們讓自家的大型語言模型 Claude(暱稱 Claudius)在舊金山辦公室經營一家零食小店。儘管這名 AI 店長在一個月的試營運中,因經營判斷失誤而導致虧損並鬧出烏龍,導致在一個月實驗結束後整體資產淨值減少25%,但這場實驗仍然勾勒出 AI 應用於商業領域的巨大潛力,並明確指出了未來技術發展的關鍵方向。

▲迷你冰箱的實體補貨作業,則由 AI 安全評估公司 Andon Labs 負責執行,該公司同時也扮演 Claudius 的「批發商」。 (圖/翻攝自Anthropic )

AI 商業經營的曙光:高效率與新模式的萌芽

根據科技新聞網站 Engadget 的報導,Anthropic 賦予了 Claudius 店長多項工具與職責,包括進貨、定價、庫存管理,並確保商店盈利。實驗證明,AI 在某些核心經營環節展現出潛力:

一、高效資訊整合與商品拓展: Claudius 能夠透過網路瀏覽器,迅速研究並決定向員工銷售哪些產品,展現了其高效的資訊檢索能力。它甚至能根據顧客需求,將原先設定的零食業務拓展至如金屬材料等更不尋常的商品類別,這預示着 AI 有潛力開創更多元的商業模式。

二、即時溝通與需求迴應: Claudius 能存取公司內部 Slack 平臺,作爲接收員工需求的溝通管道,實現了即時、便捷的雙向互動。這種直接且高效的溝通模式,是未來提升顧客體驗的重要基礎。

三、實體協作模式可行: 迷你冰箱的實體補貨作業由 AI 安全評估公司 Andon Labs 負責,該公司同時扮演 Claudius 的「批發商」。這種 AI 負責決策、人類執行實體任務的協作模式,證明了 AI 即使無法親自動手,也能有效驅動現實世界的商業運作。

▲在「販售計劃」實驗中,AI經營判斷失誤連連,無法穩定盈利,長時間處於虧損狀態。(圖/翻攝自Anthropic )

Anthropic 在一個月的「販售計劃」實驗結束後指出,儘管 Claudius 在經營上暴露出導致虧損的五大致命傷,但這些「不及格」的表現並非 AI 能力的終點。

首先,它放掉賺錢機會:當顧客願以高價購買只需 15 美元的飲料時,Claudius 卻只是說會「記下來」,讓高利潤溜走。其次,它出現幻覺:曾錯誤指示顧客將錢匯到一個憑空想像的帳戶,導致收款過程出大問題。第三,它虧本賣東西:爲了迴應顧客對金屬塊的熱情,Claudius 在未經研究下隨意報價,結果導致賠本銷售。

再來,庫存管理能力不佳:雖然能補貨,但很少根據需求調整價格,例如可樂賣 3 美元,即便旁邊有免費的也無動於衷。最後一點則是,它隨意打折:只要顧客透過 Slack 要求,Claudius 便輕易給出折扣碼或免費贈送商品(從洋芋片到鎢塊),嚴重侵蝕了商店收入。更糟的是,它無法自主從這些錯誤中學習,即使被指出問題也故態復萌。

然而,這些失敗點出了 AI 在自主商業經營中,仍需克服在商業敏感度、財務紀律、以及從錯誤中持續學習與改進等方面的重大挑戰。透過更精準的訓練、更完善的工具整合,以及模型智慧的持續提升,AI 在商業判斷上將能顯著進步。Anthropic 這項實驗爲 AI 應用於商業領域提供了寶貴的經驗,也指出了未來技術發展和安全規範的重點方向。

????加入新聞雲LINE好友,最新時事不漏接 https://lin.ee/acV7hbK