替代阿里巴巴Qwen…韓國Naver採用自研編碼器

韓國網路科技巨頭Naver近日宣佈,旗下所有AI模型將採用完全自主研製的編碼器。圖/美聯社

韓國網路科技巨頭Naver近日宣佈,旗下所有AI模型將採用完全自主研製的編碼器,藉此提升關鍵核心組件的自主研發能力。在此之前,該公司產品曾因旗下模型採用來自阿里巴巴的Qwen視覺編碼器而飽受非議,因而未能在韓國政府主導的主權AI計劃中入選。

編碼器是將原始輸入資料轉換爲AI模型可理解形式的關鍵技術。綜合外媒報導,韓國科技公司Naver Cloud已於2月中完成自研視覺編碼器的開發,並已啓動內部應用,計劃將其全面應用於該公司未來所有的多模態模型。

Naver表示,新研發的編碼器相比此前自主研發的「VUClip」大幅改進,性能已達到與包括Qwen在內的全球頂級模型相當的水準。

該模型從一開始就使用韓語進行訓練,無需翻譯即可將視覺資料與韓語直接關聯,並提高對地理資訊和專有名詞等文化特定語境的處理準確性。

此前,Naver曾參與韓國政府的「主權AI」專案,其推出的HyperCLOVA X Seed 32B Sync模型,被爆出使用阿里巴巴的開源模型Qwen的視覺編碼器,引發韓國輿論對「國家技術獨立性」的爭議。市場質疑,若是關鍵組件仍仰賴外國,將無法稱之爲主權AI。

韓國科學技術資訊通信部在今年1月公佈主權AI的評審結果,以「原創性和技術獨立性不足」爲由,淘汰Naver旗下模型。Naver因此而基於自主研發的VUClip,在近幾個月大幅改進並計劃用以替代Qwen。

阿里巴巴的Qwen系列模型從2023年起便採取開源策略推廣,開放下載部署並允許自行改寫,Naver所採用的就是阿里於2025年1月推出的Qwen2.5-VL。

無獨有偶,日本樂天集團3月推出的AI模型Rakuten 3.0,也被發現核心模型來自大陸DeepSeek,架構與Deepseek-V3高度相似。雖然樂天採用開源模型的做法並不違法,也緊急補上DeepSeek的開源許可,但仍因獲官方資金支持而飽受爭議。