“6·18”數字人捲起來了,老羅分身六小時帶貨5500萬元?

“主包強烈給大家推薦哈”“給大家爭取了比之前都要好的福利”……自“6·18”大促啓動以來,直播洪流中24小時都有人用不同話術、機制,在爲GMV、在線觀衆數、點贊量和粉絲轉化而努力。

近兩年在直播帶貨上有明顯淡出的羅永浩,也在這期間在百度電商開了兩場直播。但是第二次直播即6月15晚,出鏡的並不是那位真實的、站在鏡頭前的老羅,而是他的數字人。

一位搶到了1元可樂的買家,在觀看了直播後向作者表示:老羅“語不驚人死不休”,熟悉的語氣、接地氣的評論,還有和朱蕭木的打趣互動,彷彿回到了過去的“發佈會現場”。

直播結束後,百度官方給這一次“真假難辨”的實驗,公佈了數據:直播6小時、GMV突破5500萬元、觀看人次超1300萬,部分品類銷量超越5月真人場。對於整體效果,百度副總裁、電商總經理平曉黎在接受媒體採訪時表示,是超預期的,一個是原本預計GMV不會超過5000萬,另外一個是人均觀摩時長超過5月真人場。

除了數字人羅永浩以外,不難發現今年大促期間,各大平臺和商家,開始將數字人主播應用到直播帶貨場景。在這背後是不是AI能力的進化,驅動行業更大規模的落地?於中小商家而言,成本是否可控?如果想進入到這個行業,是否還有機會點?這已然成爲大家關心的話題。

天使投資人、資深人工智能專家郭濤表示,數字人直播的核心價值在於成爲“標準化服務模塊”:一是降本增效,24小時開播、無需休息,大幅降低中小商家門檻;二是流量精細化運營,通過算法優化話術,精準觸達夜間、促銷等碎片化時段用戶;三是延伸IP價值,頭部主播數字人分身可提升變現效率。

但是他也表示數字人直播仍然面臨一些挑戰,比如缺乏臨場應變力和情感共鳴,難以處理複雜諮詢。對於未來整個直播電商行業的發展,他認爲將呈現“人機協同”趨勢——真人主播聚焦爆款打造,數字人負責標品銷售,行業競爭轉向“供應鏈+數據算法”的綜合效率。

雙數字人直播

第二次在百度的直播畫面中,羅永浩和朱蕭木熟悉地坐在一起,背景佈置和燈光風格都與以往無異。兩人在直播間也默契互動,比如在介紹某款產品時,老羅數字人拿起商品,朱蕭木數字人會自然而然轉頭、接話講解;當老羅講解“跑偏”時,朱蕭木也能及時“打斷”並引導回主題。

兩人的互動也引起了關注在彈幕區發起“哈哈哈”的笑聲,並有不少人問“這真不是真人?”。實際上對於羅永浩,其早有預告:6月12日,羅永浩發微博稱其數字人將於15日在百度電商開播,歡迎各位老朋友來當“人肉驗真儀”。據悉,羅永浩是首位用數字人直播帶貨的頭部主播。

令業界意外的是,朱蕭木也是數字人,也就是說這其實是一場由兩個數字人完成的“AI雙人秀”。6月17日,平曉黎告訴作者,之所以選擇雙人一方面是目前業內還沒有這麼做的,另一方面是頭部主播雙人直播是直播的一大特點,“除了主播、副播,還有氛圍組這些角色已經可以實現了。在適時的時候鼓掌、捧場。”

直播結束後,羅永浩在其個人社交賬號上分享了自己的感受:看着兩個數字人在鏡頭前眉來眼去,講着和我一樣風格的段子,有種恍如現實的奇妙感覺。

在6月18日的百度AI Day活動上,平曉黎宣佈,百度優選將與“交個朋友”達成戰略合作,羅永浩將擔任百度慧播星首席體驗官,入駐百度優選平臺,不定期進行“真人+數字人”直播。

深度科技研究院院長張孝榮認爲雙人數字人直播是行業內的一次重要創新,將頭部主播與數字人技術結合,給直播電商帶來新體驗,有利於提高直播效率和商業價值。

在郭濤看來,老羅數字人與百度電商的合作本質是“技術+流量+生態”的三重互補。對百度而言,電商是其長期短板,數字人直播既能降低內容成本,又能與搜索流量結合形成“即搜即買”閉環,契合其“知識+服務”生態定位。

“對老羅團隊而言,數字人突破真人主播的物理限制,實現全時段覆蓋,延長IP商業價值,同時爲百度電商提供技術可行性驗證,吸引品牌入駐。這一合作的象徵意義大於短期收益——若“數字人+搜索流量”模型跑通,將重構直播電商的流量分發邏輯,爲百度電商打開增量空間,挑戰現有行業格局。”

多模態賦予數字人“神似”

過去兩年多來,從chatbot到文生圖片,再到文生視頻,大模型帶來的交互方式變革仍在繼續。在數字人領域,Transformer、Diffusion Models、DiT(基於Transformer 架構的擴散模型)正在賦予數字人從“形似”到“神似”跨越的能力。

據介紹,此次羅永浩數字人首秀背後,是多模協同數字人技術的落地表現。百度集團副總裁吳甜表示,多模協同的數字人技術,基於文心 4.5T 實現了融合多模規劃與深度思考的劇本生成,由劇本驅動數字人多模協同,實現動態決策的實時交互,使數字人的“神、形、音、容、話”達到高度統一。最終呈現出一個具備高表現力,內容吸引人,人-物-場可自由交互的超擬真數字人。

她介紹道,劇本生成技術包含臺詞生成、多模驅動和動態交互三部分。以羅永浩數字人劇本爲例,基於文心大模型4.5 Turbo生成的劇本,充分展現了主播的個人特色,具備典型的羅氏幽默風格,並能夠實現雙人主播的內容協同,動態實現豐富的實時互動。

通過文本自控的語音合成大模型,實現高復原的語音合成能力,再結合直播臺詞及發音人特徵,合成風格恰當、自然流暢的聲音。比如某些段落中,當朱蕭木調侃老羅“你上次說這款不好來着”,數字人老羅會帶着頓挫地迴應“我是說那一批……這一批升級了嘛”,這種輕微的“情緒起伏”也被完整保留。

爲解決羅永浩數字人直播雙人聲音配合的難點,百度採用對話上下文編碼器,將對話歷史輸入和當前對話進行語音合成的統一推理計算,最終實現流暢、自然的雙人對話效果。

那達到羅永浩數字人直播這樣的效果需要多少成本?平曉黎透露,暫時還沒有計算過,不過單個數字人制作已經控制在千元了。並預期三個月左右的時間,(類羅永浩這樣的數字人)成本也能逐步降下來。

百度集團副總裁吳甜介紹道,具體的成本數據會因每場直播而不一樣,數字人直播成本包括兩方面,一個是生產製作成本,一個是IT成本。“所有的新技術都有降本的過程,從技術角度看,我們對於未來規模化和降本還是有很大空間的”。

數字人正在滲透直播平臺

仔細觀察,今年“6·18”各大電商平臺上,無一例外能看到不少數字人在直播,其中還有很多品牌商家選擇了用數字人直播,甚至三星這類大品牌也用數字人在帶貨。

去年6月,以劉強東爲形象的“採銷東哥”AI數字人,在直播間開啓直播,後面格力董明珠、名創優品葉國富等又帶火了“總裁”數字人潮流。最近的則是羅永浩數字人在百度電商的“首秀”引發廣泛關注。

艾媒諮詢最新數據顯示,虛擬數字人直播滲透率已突破60%,成爲推動電商發展的動力之一。

國際數據公司(IDC)於近日發佈了《中國2024年中國AI數字人市場份額》,IDC數據顯示,2024年中國AI數字人市場規模約41.2億元人民幣,相比2023年增長85.3%;市場主要參與廠商包括百度、華爲雲、小冰、商湯科技、追一科技等。

IDC預計到2029年,市場規模將達到250.5億元人民幣,2024—2029年CAGR達43.5%。從市場佔有率來說,頭部廠商之間的差距比較小,市場也仍還沒出現一家獨大的情況。但是,在這過程中,不少創業公司已經經歷了一輪洗牌。

杭州一家數字人創業公司創始人告訴作者,已經不做這一塊業務了,“平臺能給的公域流量有限,交付結果很難達到理想效果。”他認爲創業公司再進入的機會並不大了,未來的競爭是各個平臺數字人之間的競爭。平曉黎表示,對於大廠之間的競爭,她覺得技術是一個很重要的底層因素。

據郭濤觀察,數字人賽道雖已進入技術同質化、場景趨同化的洗牌期,但細分領域仍存機會:一是垂直場景深耕,如跨境電商、本地生活、教育等領域,需適配多語種直播、方言交互等解決方案;二是構建技術壁壘,發力實時語義理解、情緒感知等交互能力,從“工具”升級爲“智能銷售員”;三是商業模式創新,提供“數字人+SaaS+代運營”打包服務,降低中小企業使用門檻。創業者需聚焦細分需求,用“垂直場景×AI”建立護城河,而非陷入通用型數字人的紅海競爭。