手機能暢玩 國內首個視覺基座大模型“橘洲”正式上線
“提示詞是‘輕舟已過萬重山’。”隨着指令落下,不到15秒,一幅山水景緻躍然屏幕之上,李白筆下的詩意被精準展現。5月21日,國內首個基於國產算力預訓練的視覺基座大模型——“橘洲”V1端側版在長沙正式上線,其在“斷網”條件下上演驚豔首秀,標誌着我國在視覺大模型領域實現從“雲端依賴”到“端側自主”的跨越,並以“輕量化、高精度、強隱私”的技術突破,鏈接文生圖片與千行百業。
當前,全球AI競賽已進入“端側部署”新階段。視覺基座大模型作爲視覺人工智能生成的基礎設施,存在推理成本高、數據隱私缺乏保障、帶寬和時延要求嚴苛等弊端,端側通用視覺大模型成爲破局關鍵。
作爲湖南省100個標誌性數字新基建項目,“橘洲”由湖南匯視威智能科技有限公司(以下簡稱“匯視威”)依託中科曙光算力自主研發,是基於國產算力預訓練的視覺基座大模型。區別於當前主流的視覺生成大模型,“橘洲”既可以在飛行模式下,實現智能手機端1024×1024分辨率圖像的秒級生成,也能滿足在移動端上的部署和推理需求。大大節省算力成本的同時,徹底打破創作場景的時空限制,爲視覺大模型在B端市場的落地應用帶來無限前景。
“傳統視覺大模型因參數龐大、算力需求高,長期受困於雲端部署等三大桎梏。”匯視威創始人顧善植介紹,面對這一行業痛點,其團隊以“極限蒸餾”與“架構重構”技術,將解碼模型參數量壓縮爲國外主流開源模型的1/20。在實現數據隱私安全的基礎上,在安卓和IOS端均能做到秒級生成圖片,確保用戶的個人創作不受時間和空間限制。同時,“橘洲”還具備移動端生成高分辨率圖像的能力,移動端文生圖的效果可達到國內行業先進水平。
目前,“橘洲”已經構建超4000萬張高質量圖文數據集,融入獨特的中國文化元素庫,使生成圖像更貼合國人審美與場景需求。
顧善植表示,未來匯視威將逐步拓展至文生視頻、視頻理解等領域,構建“端雲協同”的智能生態。
(湖南日報)