☰

手機能暢玩國內首個視覺基座大模型“橘洲”正式上線

“提示詞是‘輕舟已過萬重山’。”隨着指令落下，不到15秒，一幅山水景緻躍然屏幕之上，李白筆下的詩意被精準展現。5月21日，國內首個基於國產算力預訓練的視覺基座大模型——“橘洲”V1端側版在長沙正式上線，其在“斷網”條件下上演驚豔首秀，標誌着我國在視覺大模型領域實現從“雲端依賴”到“端側自主”的跨越，並以“輕量化、高精度、強隱私”的技術突破，鏈接文生圖片與千行百業。

當前，全球AI競賽已進入“端側部署”新階段。視覺基座大模型作爲視覺人工智能生成的基礎設施，存在推理成本高、數據隱私缺乏保障、帶寬和時延要求嚴苛等弊端，端側通用視覺大模型成爲破局關鍵。

作爲湖南省100個標誌性數字新基建項目，“橘洲”由湖南匯視威智能科技有限公司（以下簡稱“匯視威”）依託中科曙光算力自主研發，是基於國產算力預訓練的視覺基座大模型。區別於當前主流的視覺生成大模型，“橘洲”既可以在飛行模式下，實現智能手機端1024×1024分辨率圖像的秒級生成，也能滿足在移動端上的部署和推理需求。大大節省算力成本的同時，徹底打破創作場景的時空限制，爲視覺大模型在B端市場的落地應用帶來無限前景。

“傳統視覺大模型因參數龐大、算力需求高，長期受困於雲端部署等三大桎梏。”匯視威創始人顧善植介紹，面對這一行業痛點，其團隊以“極限蒸餾”與“架構重構”技術，將解碼模型參數量壓縮爲國外主流開源模型的1/20。在實現數據隱私安全的基礎上，在安卓和IOS端均能做到秒級生成圖片，確保用戶的個人創作不受時間和空間限制。同時，“橘洲”還具備移動端生成高分辨率圖像的能力，移動端文生圖的效果可達到國內行業先進水平。

目前，“橘洲”已經構建超4000萬張高質量圖文數據集，融入獨特的中國文化元素庫，使生成圖像更貼合國人審美與場景需求。

顧善植表示，未來匯視威將逐步拓展至文生視頻、視頻理解等領域，構建“端雲協同”的智能生態。

（湖南日報）

手機能暢玩 國內首個視覺基座大模型“橘洲”正式上線

相關資訊

手機能暢玩國內首個視覺基座大模型“橘洲”正式上線