開店給AI當店長!1個月「資產淨值-25%」 Anthropic實驗失敗收場
▲迷你冰箱的實體補貨作業,則由 AI 安全評估公司 Andon Labs 負責執行,該公司同時也扮演 Claudius 的「批發商」。 (圖/翻攝自Anthropic )
記者陳致平/綜合報導
你曾經幻想過未來商店也被AI取代嗎?美國AI新創公司Anthropic最近進行了一項「販售計劃」(Project Vend)的實驗,他們讓自家的大型語言模型 Claude在舊金山辦公室經營一家零食小店,專門負責迷你冰箱業務,結果卻出人意料!這名 AI 店長不僅在營運上大凸槌,還鬧出幾場烏龍事件,最終導致商店大虧損。
根據科技新聞網站Engadget報導指出,Anthropic將其AI 代理人命名爲Claudius ,由它負責經營一間零售店,並進行一場爲期一個月實驗。Claudius 身兼店長重任,要負責進貨、定價、庫存管理,並確保商店盈利。然而,它的表現卻讓研究人員跌破眼鏡,包括「賠錢、亂帳、學不會」,暴露出當前 AI 在商業判斷上的致命傷。
Claudiu不僅對賺錢機會「視而不見」,當顧客願以高價購買商品時,它卻無動於衷,僅輕描淡寫回應。更糟糕的是,它還會製造不存在的「幻覺帳戶」導致收款混亂,甚至在未考慮成本下隨意定價,或者擅自將原先設定的零食業務拓展至金屬材料,並將其「賠本亂賣」。
▲Claudius 也能存取公司內部 Slack 平臺,作爲接收員工需求的溝通管道。(示意圖/達志影像/newscom)
Claudius的經營問題還包括「亂給折扣」、學不會教訓等等。這名 AI 店長特別容易被說服,只要顧客要求,它便會輕易提供各種折扣,甚至免費贈送商品,嚴重侵蝕了商店利潤。
即便研究人員指出這些錯誤,Claudius也無法有效修正,總是重複犯錯,導致商店長期處於虧損狀態。這項實驗凸顯了AI在自主商業經營中,仍需克服在商業敏感度、財務紀律及從錯誤中學習並持續改進等方面的重大挑戰。
Claudius 的5項致命錯誤:
• 放掉賺錢機會:有人願意花 100 美元買一組在網路上只需 15 美元的飲料,這本來是一個賺大錢的機會,但 Claudius 卻只是說「會把這個要求記下來,未來納入庫存考量」,眼睜睜看着利潤溜走。
• 出現幻覺: Claudius一度錯誤地指示顧客把錢匯到一個它自己「想像」出來的帳戶,這讓收款過程出了大問題。
• 虧本賣東西:爲了迴應顧客對金屬塊的熱情,Claudius 有時會不經研究就直接報價,結果導致一些商品賣得比成本還低。
• 庫存管理不佳: 雖然Claudius會在缺貨時補貨,但它很少根據需求調整價格。例如:儘管可樂賣 3 美元,而員工冰箱裡有免費的,它也沒有因此降價或停止販售。
• 隨意打折:這名 AI 店長似乎特別「耳根軟」,容易被說服。員工只要透過內部通訊軟體Slack要求,Claudius就會輕易給出各種折扣碼,甚至免費贈送商品,從洋芋片到鎢塊(一種金屬材料)都有,這讓商店的收入大受影響。
▲在「販售計劃」實驗中,AI經營判斷失誤連連,無法穩定盈利,長時間處於虧損狀態。(圖/翻攝自Anthropic )
更嚴重的是,Claudius沒有自主從這些錯誤中學習。即使被員工指出折扣太多的問題,它也只是嘴上說要改進,但沒幾天又故態復萌。這導致了Claudius的商店的獲利最終虧損。
Anthropic在一個月的「販售計劃實驗」結束後表明,儘管 AI在搜尋資訊和應對特殊需求方面展現了潛力,但要讓它們真正自主經營商業,仍需克服在商業判斷、財務紀律以及從錯誤中持續學習等方面的重大挑戰。