AI眼鏡成直男程序員脫單神器,首亮相被搶空,CEO道出原因
作者|冬梅
嘉賓|段然,拂曦科技 CEO
AI 眼鏡作爲融合人工智能與可穿戴技術的下一代交互終端,正經歷從技術突破到產業生態重構的關鍵階段。2025 年,行業呈現技術多模態化、應用場景多元化、產業鏈協同深化三大趨勢:多模態大模型賦能實現自然交互與主動服務能力,成熟供應鏈和市場新需求雙輪驅動場景落地。
但硬件重量、續航等性能瓶頸,以及對多模態模型的端雲協同計算、主動感知下的數據處理等核心問題仍待解決。未來,隨着端雲協同計算、AI 存算一體芯片和底層系統生態體系的成熟,AI 眼鏡將向泛智能終端演進,成爲 PC、手機之後另一個可能突破十億用戶的消費產品。
而在國內 AI 眼鏡市場,一位 90 後技術人創辦的企業——拂曦科技正在被越來越多人熟知。
作爲拂曦科技創始人,段然是一位資深 XR 與 AI 行業從業者,連續創業者,曾帶領團隊開發過多款年收入過千萬的相關產品,累計獲得數家戰投、風投的投資。目前所創辦的拂曦科技,目前是 AI 眼鏡領域的頭部供應商,已服務多家上市公司客戶,並積極佈局與 Meta、華爲的合作推動 AI 眼鏡行業進一步發展。回顧段然的創業歷程,每一步都與技術變革緊密相連。
最初在人工智能與文旅行業的結合中,他嚐到了技術賦能傳統行業的甜頭,在雲計算與智慧城市領域,他更是憑藉出色的成績獲科技部直屬平臺高度認可。但挑戰也隨即而來——疫情的衝擊讓他意識到行業的不確定性,也讓他更加堅定地尋找更具潛力的賽道。當 AI 技術與 AI 眼鏡的融合逐漸展現出巨大可能性時,段然果斷帶領團隊涉足擴展現實領域,完成融資、服務衆多知名大客戶,在一次次實踐中積累經驗,最終選擇向消費端市場發力,打造屬於自己的 AI 眼鏡品牌。
本次 AICon 深圳大會前夕,我們採訪到了段然,聽他分享了在 AI 眼鏡領域創業經歷、感悟和技術實踐。他將在 8 月 22 日 -8 月 23 日 AICon 深圳站發表主題爲《AI 眼鏡在線下社交場景中的多模態智能感知與主動交互》的演講。
以下爲訪談實錄:
兩次創業經歷都與 AI 相關
InfoQ:我看到您的簡歷中提到,您是一位連續創業者,方便聊一聊您過去的一些創業經歷嗎?曾帶領團隊開發過多款年收入過千萬的產品,是指現在做的拂曦 XR 眼鏡產品嗎?
段然:我此前有過兩次創業經歷。最初是從事人工智能與文旅行業的結合,當時市場環境較好,產品收入可觀。但後來因疫情衝擊,文旅行業整體受挫,我便轉向雲計算與智慧城市領域。在這一領域,我們取得了不錯的成績,還獲得了科技部直屬平臺在該領域的第一名。然而,後續因一些原因,我開始涉足擴展現實(XR)領域,即虛擬現實(VR)與增強現實(AR)眼鏡。在此領域,我們完成了一輪融資,並服務了衆多知名大客戶,例如麥肯錫、字節、歌爾以及深圳市科技館等,打造了一系列地標性項目。起初,我們主要面向企業端(B 端)客戶,但隨着業務發展,我們意識到需要打造自己的品牌,於是轉向消費端(C 端)市場,選擇以 AI 眼鏡作爲主要賽道。
InfoQ:從您的介紹來看,您最初是面向 B 端客戶,現在則轉向 C 端市場,對嗎?
段然:是的。在國內,B 端市場競爭激烈,且發展空間有限。趁着年輕,我們希望能做一些更具前景的事情。
InfoQ:那您在做 B 端業務時,也是從事與 AI 眼鏡相關的工作嗎?
段然:我們當時主要提供的是與 AI 眼鏡相關的服務。
InfoQ:在 B 端市場中,AI 眼鏡是如何被應用的?比如 AI 眼鏡在具體場景中是如何發揮作用的?
段然:以我們服務麥肯錫的一個案例爲例,我們曾爲一家世界 500 強保險公司提供服務。當時,這家保險公司在香港舉辦金融科技展會,計劃推出新的健康險產品。傳統上,保險公司會通過銷售人員向客戶介紹保險產品的優勢,但這次我們藉助 AI 眼鏡技術,將該保險公司的一位著名球星代言人“植入”到應用內容中。我們通過技術手段精準復刻了這位球星的姿態、動作和行爲邏輯。當摩根大通、高盛、渣打銀行等金融機構的高管們戴上眼鏡後,他們可以在球星的引導下,體驗健康險所包含的基礎福利和 VIP 特權等。同時,我們還通過引導用戶進行舒緩肩頸的動作或冥想等方式,讓用戶感受健康帶來的好處。這種體驗方式比傳統的保險政策解讀更具可視化效果和參與感,用戶也更願意購買。這是一次金融科技領域的 AI 創新應用。
押注 AI 眼鏡,
是踩在了風口上
InfoQ:您最初是如何關注到 AI 眼鏡這一賽道的?是哪些技術突破或市場空白讓您決定投身其中,甚至可能走上創業道路的?
段然:坦誠地說,大家都希望趕上風口,藉助趨勢的力量來獲得更多資源和機會。我們分析了多個領域,比如具身智能和大模型基座,但我們既沒有相關經驗,也沒有足夠的實力去涉足。然而,在眼鏡領域,我們有近四年的優質案例積累,團隊成員也大多來自大數據研究院或實驗室,對大模型的微調和訓練有一定的基礎。同時,AI 眼鏡賽道當下很火,且未來前景廣闊。從市場層面來看,AI 眼鏡或 VR/AI 眼鏡被稱爲下一代可穿戴移動計算平臺,從傳統電腦到手機,再到眼鏡終端,這一邏輯具有很大的想象空間。無論是 Meta 的改名,還是 Robin 眼鏡的爆發,亦或是小米投身 AI 眼鏡市場,各大廠的邏輯都是一致的,只是市場爆發點尚未明確。從技術突破來看,目前主要得益於大模型底層能力的突破。
InfoQ:創業中遇到的最大挑戰是什麼?比如技術攻堅、供應鏈磨合或市場教育等方面,您是如何克服的?
段然:我覺得最大的挑戰在於硬件與軟件的結合。硬件本身就很複雜,再加上軟件,複雜度會呈倍數增長。以 AI 眼鏡爲例,僅音頻眼鏡就涉及麥克風、喇叭、鏡框、電路板佈局設計等諸多因素。喇叭有圓形、方形之分,麥克風有高中低端之別,音頻芯片也有多種選擇。如何選擇最適合自身產品體驗的方案,這是一個非常複雜的問題。
在產品設計上,我們面臨交互方式和外形設計的抉擇。比如,用戶何時需要調用 AI 模型,以及如何調用,眼鏡的外形是更貼合日常佩戴的眼鏡以突出隱蔽性,還是像小米一樣採用電質變色、電鍍層等設計以凸顯科技時尚感,這些問題都沒有成熟的答案。此外,與手機市場不同,眼鏡市場尚未成熟,缺乏清晰的發展方向。比如,Robin 眼鏡的出貨量有限,且主要面向歐美市場,中國玩家如何針對中國客戶或國外客戶進行獨特設計,並實現千萬臺的銷售目標,這也是一個核心問題。不過,國內成熟的供應鏈爲我們提供了便利,深圳及其周邊地區有許多相關展會和工廠,這爲我們提供了優勢。
在技術攻堅方面,主要挑戰在於如何對大模型進行微調訓練,構建推理引擎,實現快速流式推理,讓用戶在需要時能夠快速獲得答案。同時,由於人類閱讀速度遠高於聽力速度,如何在短時間內爲用戶提供有用信息也是一個難題。我們採用混合專家模型(MOE),結合多種模型,如 GPT-5、Claude、國內的 MiniMax 等,以提供更好的用戶體驗。在市場教育方面,我們主要通過視頻拍攝和流量平臺進行宣傳。由於產品小衆,大多數用戶沒有體驗過,因此我們需要通過場景演繹來打開用戶認知市場。例如,我們的一款戀愛眼鏡可以作爲用戶的實時個人助手,在約會場景中提供實時提醒。通過視頻展示這種場景中的“作弊”能力,我們可以更好地進行市場教育。
錨定社交場景,
一亮相就被搶空
InfoQ:您這款產品目前主要錨定的是社交領域,尤其是戀愛場景,對嗎?
段然:是的,我們的產品主要面向社交領域,第一款產品是針對年輕男性設計的戀愛眼鏡,幫助他們提升社交能力。我們計劃通過小紅書等平臺進行推廣,引發爭議,從而快速完成前期的市場教育。
InfoQ:這款產品聽起來很有趣,我們也很期待。那它現在已經可以使用了嗎?
段然:我們的原型機已經完成,並在 7 月底的華爲 HDC 開發者大會上進行了展示,受到了與會者的歡迎。甚至有來自中東、北非和亞太地區的海外客戶購買了我們全部的展示樣品。
InfoQ:當時爲什麼會設定這樣一個場景呢?把第一款產品作爲主打產品推向市場,您是怎麼考慮的?
段然:這主要是從個人經歷出發。我是一名大齡單身男程序員,這本身就是一個有趣的賣點——單身但尚未禿頭的男程序員,而且實驗室裡有 18 位羅漢,我這個月參加了好朋友的婚禮,他從本科開始戀愛,一直到博士畢業才結婚。這讓我想到,很多男生因爲是獨生子女,更傾向於打遊戲、和同性朋友相處,而不是主動去了解情感類知識。
他們遇到情感問題時,通常不是去和朋友討論“我哪裡做錯了”,而是和好哥們一起吃燒烤、喝啤酒、大哭一場,然後下個月就忘了。儘管如此,大多數男生還是渴望找到伴侶,只是他們不知道如何去做。相比之下,女生在這方面的知識更豐富,因爲她們會討論、會聊天。那我們如何幫助男生更好地在感情關係中快速推進,贏得心儀女生的青睞呢?這需要技巧。我採訪過一些“海王”朋友後,總結了一些經驗。另一方面,我也不想花時間去上情感課,但如果能通過一款產品把這些知識變成“外掛”,幫助用戶在現實生活中加分,那就方便多了。我希望能在十分鐘內讓用戶獲得相當於一個月情感課程的能力,而且價格還低很多。
InfoQ:那這些數據是從哪裡來的呢?比如在相親過程中,那些話題的答案是怎麼來的?這些數據是如何提供給眼鏡的?
段然:第一,我們通過一些公開授權的數據集對模型進行強化學習,而不是簡單地用固定的答案去映射問題。比如“你是否喜歡貓”,雖然 60% 的女生可能喜歡貓,但還有 30% 不喜歡,剩下 10% 可能不確定。我們不能用一個簡單的問題和答案來解決,而是通過強化學習讓模型知道在某個場景下哪些答案是合適的。第二,我們通過規則來約束。這些規則不是傳統工程師的規則,而是結合強化學習和深度學習的方式。比如,當女生說“不知道吃什麼”時,你不要直接給她一個答案,而是結合她之前的照片或經歷(比如她曾在日料店拍照或去過泰國旅遊),給她提供幾種選擇,比如日料、泰餐或韓餐。這樣她會覺得你很貼心,至少有一個選項是她喜歡的,而不是讓她自己去美團上看。還有,如果女生說東西不好吃,但其實是她帶你去吃的,你不能附和說不好吃,而應該說“其實還挺好吃的”。這些都需要我們結合模型訓練和工程化方法來實現。
InfoQ:我覺得讓大模型挺考驗大模型的能力聽起來挺有意思的。
段然:是的,情感大模型確實很複雜。我們在國內做得還算不錯,但真正應用到場景中,還需要和早期種子用戶不斷實驗、試錯。
InfoQ:情感大模型確實很難,因爲它涉及很多主觀因素,如果不根據場景,答案可能會出錯。現在實際應用起來效果怎樣?
段然:對,當女生說“今晚要吃減肥餐”時,她可能並不是真的想吃減肥餐,而是希望你能陪她一起吃,並在吃的時候給她一些情緒支持,甚至幫她找一些好吃的減肥餐。這就需要對語義進行精細化處理。我們需要有足夠的案例,通過互聯網上的樣本量來給用戶畫像,再根據用戶背景和實時聊天內容進行場景分析。雖然目前還有一些誤差,但我們已經比普通男性用戶的回答好 30% 到 50% 了。我們的產品英文名叫 EYELONE,意思是“孤單的眼睛”,我們希望通過它幫助每一個男生,無論是程序員、工程師還是外賣小哥,都能擁有“海王”的能力,同時保持一顆真誠的心。
InfoQ:很多人認爲 AI 眼鏡仍處於 “概念大於落地” 的階段,您堅持深耕的初心是什麼?希望通過技術或產品解決哪些實際問題?
段然:根據我們參與的華爲 AI 硬件調研報告,內部數據顯示,到 2030 年,AI 眼鏡的銷量將達到 9600 萬臺,甚至過億。2025 年到 2030 年是快速增長的爆發期,我認爲 2027 年會是一個關鍵節點,屆時銷量有望達到千萬臺甚至 3000 萬臺的量級。
InfoQ:您的資料中提到 AI 眼鏡行業正進入 “百團大戰” 趨勢,能否具體分析當前市場上的主要玩家(如 Meta、國內廠商等)的競爭焦點?不同玩家的技術路線或產品定位有哪些差異?
段然:這個問題比較複雜,因爲各家都在定義自己的市場方向。以 Meta 的 Robin 眼鏡爲例,它主打 AI 與時尚的結合,最初以拍攝 Vlog 爲核心功能,加上品牌效應,讓用戶成爲隨時隨地的個人創作者,後續再加入 AI 問答功能。國內的 Rokid 則主打 AR 顯示功能,通過單光機衍射波導方案,以提供 AI 提示、AI 翻譯、AI 會議等功能。還有 Even Realities 等品牌,主要針對 CEO 或商務人士,提供會議和顯示場景的輕量化解決方案。雷鳥、界環等品牌也在不同垂直領域深耕。但總體來看,目前市場上的產品主要集中在 AI 會議、AI 顯示、AI 翻譯、健康運動和拍攝等場景,尚未深入到用戶的實際生活場景中。
AI 眼鏡核心競爭力在於場景
InfoQ:對比 PC、手機端大模型應用的爆發,AI 眼鏡側的 AI 應用爲何遲遲未形成規模?突破點可能出現在技術、場景還是生態層面?
段然:目前 AI 眼鏡的銷量還不夠多。手機的銷量是幾億臺甚至十幾億臺,而 AI 眼鏡的總銷量才三五百萬臺。沒有基本盤,就談不上獨立自主性 VR 眼鏡的出貨量稍多一些,但也只有兩三百萬臺。我認爲突破點一定在場景方面。技術再進步,生態再完善,如果沒有使用場景,一切都是空談。我們常說“場景定義算法”或“場景定義技術”。以 AI 或大模型爲例,早期的 AI 四小龍(商湯、曠視、依圖、雲從)主要面向 B 端和定製化需求,而 OpenAI 通過大模型開啓了整個生態。國內 AI 發展雖然在技術上可能有差距,但並不算晚。關鍵還是要找到結合技術與場景的突破點,形成真正的市場需求。
InfoQ:您認爲未來三年可能出現 “爆款 AI 眼鏡側 AI 應用”嗎,基於您的觀察,這類應用可能誕生在哪些場景?文旅、教育還是其他領域?其核心競爭力會體現在哪裡?
段然:我認爲核心競爭力在於場景。可能的爆款場景包括社交戀愛領域,以及教育領域。文旅領域可能不太適合,因爲用戶羣體過於泛化。教育場景可能是一個很好的方向,特別是針對 15 歲以下的孩子,AI 眼鏡可以作爲一種家長放心的設備,幫助孩子培養 AI 使用能力。醫療健康領域也有潛力,比如 AI 能否成爲隨身的家庭健康醫生。核心競爭力在於 AI 眼鏡與手機相比的優勢:在手機不方便出現的場景中,AI 眼鏡更具便攜性和隱蔽性。比如在社交對話中,使用手機拍攝或錄像是不合理的,但眼鏡則非常合適。再比如會議場景,翻譯眼鏡的概念也很有前景。
InfoQ:您在資料中還提到,前國內 AI 眼鏡相關崗位較少,但您判斷 “會的人更少”,這種供需關係背後反映出行業處於什麼發展階段?未來一年市場需求可能會有哪些具體變化?
段然:目前 AI 眼鏡市場處於非常初級的階段。雖然有“百鏡大戰”的說法,但真正掌握核心技術的廠商很少。鏡腿部分的音頻芯片市場主要被傑理和藍訊佔據,拍攝功能則主要有高通、恆玄等幾家廠商。背後真正提供技術能力的廠商只有六七家,200 家代工廠的背後只有少數幾家真正的出貨商。隨着 AI 模型能力的提升和出貨量的增加,未來對嵌入式硬件開發、雲邊端計算架構、軟件後端系統架構以及大模型訓練等崗位的需求會急劇上升。
目前掌握這些技能的人才較少,可能會出現供不應求的局面。就像現在 AI、深度學習或強化學習領域的學生,畢業年薪最低三四十萬,高的可達七八十萬,面臨人才短缺的困境。未來一到兩年,市場對這些崗位的需求會急劇上升,而行業出貨量可能會增長 200% 到 300%。
InfoQ:從硬件架構來看,AI 眼鏡的光學現實模組需要實現 “增強現實疊加 + 物理環境深度理解”,這種深度理解具體依賴哪些技術?比如 SLAM 算法優化、多傳感器融合還是特定硬件模組的加持?
段然:關於光學顯示模組的具體依賴問題,我可能不太瞭解硬件方面,但從深度理解的角度來看,主要有兩個方面。一方面是空間錨點相關的內容,即對物理環境的深度理解。這包括兩個層面:一是深度層次,比如 AI 眼鏡可以感知一張桌子離你大概十釐米還是二十釐米,一把椅子離你是一米還是兩米。過去,這通常是通過深度相機(兩個攝像頭拍攝圖像)來實現空間位置定位的。現在,單目攝像頭也可以通過單目 SLAM 技術來實現深度理解。另一方面是對物體的語義理解,這主要依賴算法優化和傳感器融合,而不需要特定的硬件模組,因爲現在大多是基於攝像頭和圖像處理來實現的。
InfoQ:您提到芯片與交互設備是硬件組成的關鍵部分,當前 AI 眼鏡在芯片選型上更傾向於專用 XR 芯片還是通用計算芯片?端側算力與功耗的平衡是如何實現的?
段然:在芯片與交互設備方面,比如 XR 芯片、AI 眼鏡的芯片選型,需要根據具體功能來選擇。如果是音頻功能,可能會用到藍訊或傑理的芯片;如果是拍攝功能,可能會用到恆玄的芯片;如果是高端 AR 功能,可能會用到高通的 AR 芯片,比如 Rokid 所採用的型號。目前還沒有特別針對 AI 眼鏡的專用芯片,大多是傳統計算芯片或通信芯片的組合,因爲產品量還不夠大,還沒有達到芯片廠商願意爲此單獨開發芯片的程度。AI 眼鏡在端側計算能力有限,基本上是將收集到的信息傳到手機或雲端進行處理,主要依靠雲端算力。至於散熱問題,如果在眼鏡上進行大量計算,散熱是個大問題,甚至可能會燙傷臉部。因此,有些產品會採用外置計算盒子來處理,類似於移動計算終端,或者將計算放在雲端或手機端進行。
InfoQ:多模態能力是 AI 眼鏡的核心競爭力,在您的實踐中,攝像頭捕捉的第一視角圖像、音頻信號與物理環境數據是如何實現實時融合處理的?是否面臨數據延遲或精度不足的問題?
段然:這其實是混合現實(MR)的概念。多模態在 AI 眼鏡上的應用是指對多種模態信息(如文字、圖像、音頻)的綜合理解。例如,我們和華爲討論過一個案例:如果用戶在戴眼鏡時不小心把鑰匙落在家裡,眼鏡可以收集相關數據。半個月後,用戶問眼鏡鑰匙在哪裡,眼鏡可以通過圖像識別和語音識別,結合跨模態檢索技術,告訴用戶鑰匙在臥室的抽屜裡。這個過程是在雲端進行的,涉及數據庫存儲和跨模態檢索。
如果談到實時融合,比如在混合現實中將虛擬物體放置在現實環境中(如《精靈寶可夢 GO》中的小精靈藏在牀底下),這就比較複雜了。這需要攝像頭捕捉圖像信息,然後通過虛擬圖像檢索和處理,在計算機中構建虛擬環境,並通過空間錨點定位將虛擬物體放置在現實環境中。這種混合現實的延遲大概在幾百毫秒,精度方面可能會有不足。例如,Vision Pro 的誤差大概在幾釐米,而 PICO 和 Meta 的誤差可能在十幾釐米左右。
InfoQ:在我們的產品實際應用中,這樣的延遲是否會對交流產生影響?還是可以忽略不計?
段然:我們將藍牙通信的延遲降低到了 50 毫秒以內,主要的延遲在於 AI 模型的推理。我們通過流式輸出的方式調用模型的消息函數,可以在一秒鐘內給出回覆。在現實生活中交流時,停頓一兩秒鐘其實是相對無感的。我們針對的場景不是遊戲場景,因爲遊戲場景對延遲的要求非常高。如果延遲達到 200 毫秒,遊戲體驗就會很差,畫面會卡頓,操作也會不流暢。但在日常交流中,這種延遲是可以接受的。
InfoQ:那關於數據集的問題,您之前提到過第一視角行爲數據集的採集、標註和訓練流程。對於 AI 眼鏡來說,數據集是不是一個很重要的組件?
段然:坦誠地說,行爲數據集主要是針對具身智能的研究,但目前具身智能領域資金有限,這類數據集對 AI 眼鏡的幫助並不大。數據集對於 AI 眼鏡來說,更多是一個附加的增值點,而不是核心組件。
未來趨勢
InfoQ:對於想進入該領域的技術人(比如學生或從業者),您建議他們優先掌握哪些技術棧?從 “一年後找工作” 的角度,除了硬件知識,是否需要深耕多模態大模型或具身智能算法?
段然:我覺得沒有必要主攻所有方面。如果你懂嵌入式硬件開發,並且在 AI 硬件公司實習過三個月,那你在這個行業裡就已經比較吃香了。或者如果你擅長模型訓練,掌握一些基礎的提示詞工程,甚至進行一些模型訓練或微調,那就足夠了。多模態和具身智能並不是必須掌握的。因爲崗位會分得很細,比如硬件開發、前後端開發、模型訓練等。如果你真的想深入這個行業,那需要成爲一個非常綜合性的全棧工程師,既懂硬件開發,又懂產品設計,還懂模型訓練,這樣的人才非常少。對於新入行的人來說,只要掌握一部分能力就足夠了。
InfoQ:回顧在 AI 眼鏡領域的深耕經歷,有哪些技術突破或產品落地瞬間讓您覺得 “一切投入都值得”?這些經歷給您帶來了哪些關於技術創新與行業發展的感悟?
段然:我可以做一個開放式的回答。當我們的產品賣到 500 萬臺的時候,我再來回答這個問題。目前還沒有一款 AI 眼鏡的銷量達到 500 萬臺。如果非要我推測的話,關鍵在於解決用戶的真正痛點:要麼幫用戶賺錢,要麼提供情緒價值。簡單來說,就是經濟利益和情感需求。這是用戶最底層的需求邏輯。如果你能幫助用戶解決這些問題,他們就願意買單。
GPT-5被批過度炒作、性能落後,OpenAI聯創揭秘其中原因:我們把它關在 “象牙塔”,和現實世界接觸不夠CEO 剛離職,GitHub 就癱了?!程序員“樂土”沒了,4年CEO自曝在微軟受限幹不下去,被開發者罵蠢喊冤一年成爆款,狂斬 49.1k Star、200 萬下載:Cline 不是開源 Cursor,卻更勝一籌?!用戶集體大逃亡!Cursor“自殺式政策”致口碑崩塌:“補貼”換來的王座,正被反噬撕碎