32B方案成本已做到萬元級!零售業加速部署大模型,智能體 AI生鮮識別率先成熟|行業動態

財聯社5月12日訊(記者 付靜)“當貨架上的電子價簽在閃爍的時候,您可能不知道它也正在經歷一場毫米級的、非常高難度的算力革命,可能正在打價格戰。”剛剛落下帷幕的2025中國零售業博覽會上,中國連鎖經營協會副秘書長楊雯表示。

財聯社記者觀察到,此次博覽會多家A股公司亮相,集中展示了零售行業全產業鏈上的前沿技術、創新設施設備、特色商品及智慧零售解決方案,DeepSeek、智能體也“跨界”成爲從業者口中的關鍵詞。據悉,全球零售業正經歷轉型變革,技術側,頭部零售企業正探索基於行業數據和知識的智能體和AI模型,零售硬件方案商則向智能服務商升級,底層的算力層也已形成完整解決方案。

零售業多場景加速AI化

財聯社記者在博覽會上注意到,衆多零售行業頭部企業正加速數字化步伐,如天虹股份(002419.SZ)旗下靈智數科於去年9月發佈首個零售行業大模型百靈鳥AI大模型;絕味食品(603517.SH)推出了AI點餐智能體“絕味小火鴨”;百果園則利用AI輔助私域營銷內容生成。

工控方案商深圳市吉方工控有限公司副總經理李曉濤向財聯社記者介紹,在零售場景,8B大模型可進行人流預測、商品檢驗、導購;14B大模型可實現簡單的報表分析;32B大模型可進行圖譜指引、數據預警;70B大模型則可扮演大區經理的角色。

財聯社記者獲悉,在大模型的應用場景方面,目前物品識別在業內已較爲成熟。博覽會現場,石基信息(002153.SZ)子公司海石商用展示的POS產品方案支持物品識別算法,可對生鮮商品進行精準識別和稱重。

“CPU和GPU的性能在零售場景中已經開始出現冗餘,單純的算賬和支付並不需要太高的性能,但AI場景開始顯現出來,最早被提出並解決的問題就是生鮮識別。現在大家在很多超市裡看到,在秤上無需人工選擇商品,只需將黃瓜放上去,系統就能自動識別爲黃瓜,這就是AI在該行業中最成熟的應用。”海石商用副總經理李昊旻稱。

李昊旻向記者介紹,海石商用希望在生鮮識別之後實現散裝商品的稱重識別,最終將其推廣到標準品的識別上。“前兩步我們已經基本完成,無論是生鮮還是零食食品,現在已經在行業內得到廣泛應用。”此外,該企業還在着手進行AI+超市收銀通道識別、購物車遺留商品監控等方案的研發。

他進一步表示,當前零售業最需要解決的是自助防損問題。“據我們統計,大約有2%-3%的商品,顧客本想掃描,但由於未對準或其他原因,未能成功完成掃描動作。顧客並非有意偷盜或拿走商品,但由於掃描動作不夠準確,會給超市造成損失。”

基於此,海石商用自研防損算法,此外在現有算力攝像頭基礎上增加了TOF傳感器,可更精準地判斷收銀動作是否正確完成,約80%的無意異常將被識別到。

32B模型方案成本已做到萬元級

值得關注的是,由於零售爲“成本依賴型”行業,即便零售行業多場景均在加速AI化,當前零售場景中硬件設備老舊的情況依然較常見。“零售業從業者可能會用幾年甚至十年前的設備,很難直接替換成能夠滿足AI需求的設備,這是我們面臨的一個很大的困難。”李昊旻表示。

對此李曉濤認爲,如果前端設備的性能不夠,勢必就要更新換代;如果性能夠,用戶依然不願意投入費用進行更新,就需要有更具性價比的方案。

李曉濤稱,未來與大模型互補的智能體將是行業更需要且更有用的工具。“智能體最大的優勢就是成本。在不借助顯卡的情況下,7B、8B的模型能夠直接運行;14B的方案加上顯卡基本上可以做到萬元級別。我們內部評估,如果可以做到萬元級別,而且可以服務20個人的公司,用戶就會願意(購買方案)。”

“我們和合作夥伴在32B模型上投入較多。許多合作伙伴在綜合考量部署成本和應用場景後,認爲32B模型在成本、效率和精準度之間取得了良好的平衡,因而在行業應用中具有較高的合理性。”博覽會期間,英特爾方面這樣告訴財聯社記者。

英特爾方面介紹,以DeepSeek爲例,在32B模型的數據處理中,在商超或邊緣計算場景中部署一臺服務器前端可支持24路併發,若考慮冗餘前端支持設備數甚至可達到36-48臺。“一臺設備就能夠控制如此多的終端,並且整機成本控制在4萬-5萬元之間,這是一個極具性價比的方案。”

據瞭解,底層算力層面,目前針對不同算力需求也形成了完整解決方案。

英特爾方面向財聯社記者介紹,一塊CPU硬件將支撐中小門店幾乎所有IT信息化所需的算力需求。具體來看其方案包括:端側基於酷睿Ultra處理器的方案可提供智能導購、缺貨提醒、商品推薦及廣告等功能;邊端設備基於酷睿Ultra處理器和銳炫獨立顯卡,爲陳列合規檢測、人流動線分析等門店管理工作提供數據處理支持,且能與邊緣服務器進行數據交互。據悉,邊緣服務器可由至強處理器和銳炫獨立顯卡支持,用於運營業務邏輯較複雜的ERP代碼生成、企業內部管理、大型門店監控、高併發客羣分析等場景下的大模型業務。

“對於極端場景,需要運行如671B的更大規模模型,英特爾也提供至強CPU搭配Gaudi加速器的方案。”英特爾方面稱。

財聯社記者從英特爾方面最新獲悉,Intel 18A製程節點已進入風險試產階段,將於年內正式量產,英特爾亞利桑那州的Fab 52工廠已完成Intel 18A流片;2027年,英特爾則將Intel 14A風險試產作爲目標。

談及在智能體方面的進展,李曉濤告訴記者,基於酷睿Ultra系列,吉方工控的智能體硬件已實現小批量生產。

另外英特爾方面預計,下半年Panther Lake客戶端處理器推出後,搭載Panther Lake的POS機除了承擔傳統POS機功能,也可進行店鋪攝像頭數據分析及更高算力需求的後臺應用,如運行大模型實現數字導購助手。