36氪首發 | 從快手獨立的AI芯片公司融資數億元,視頻壓縮性能超英偉達
作者 | 林晴晴
編輯 | 彭孝秋
36氪獲悉,人工智能芯片企業「凌川科技」近日完成數億元A輪融資,由北京市人工智能產業投資基金和快手集團領投,亦莊產投、順禧基金、九智資本等跟投。本輪融資將主要用於下一代芯片研發、現有產品SL200的量產擴產及海外市場拓展。
「凌川科技」成立於2024年3月,由北京市人工智能基金與快手集團共同發起,前身爲快手集團異構計算與芯片事業部。「凌川科技」CEO劉凌志告訴36氪,“2018年快手日活破億,傳統堆算力服務器的成本壓力已不可持續。我們從異構計算平臺切入,2020年正式立項芯片,2023年SL200在快手部署數萬顆,節省超預期成本後,拆分獨立成爲必然選擇。”
目前,SL200芯片集成了視頻編碼、AI推理、多核CPU等核心功能,部署量近數萬顆,服務7億用戶,並獲評2023世界互聯網大會“創新發展典型案例”。劉凌志強調:“互聯網基因讓我們從應用反推芯片設計,客戶需求直接定義產品,這是傳統芯片公司難以複製的優勢。”
目前,全球AI芯片市場長期由英偉達主導,其CUDA生態形成技術壁壘,但大模型推理場景對成本與能效的敏感度催生了ASIC架構的差異化需求。國內智能視頻賽道高速增長,涌現快手、字節跳動等頭部應用及“可靈”“即夢”等大模型技術,但算力芯片仍面臨美國出口限制的“卡脖子”風險。「凌川科技」瞄準垂直領域,通過ASIC架構降低推理成本,單顆芯片可處理36路視頻任務,較傳統方案節能30%,成爲國產替代的關鍵路徑。
36氪瞭解到,SL200芯片爲國內首款集成視頻編碼、AI推理、多核CPU等功能的ASIC芯片,支持萬分之一超低故障率,頭部客戶直播覆蓋率近100%。其視頻壓縮性能在MSU大賽中超越英特爾、英偉達,單路處理成本降低40%。下一代芯片針對大模型訓練推理場景設計,支持LLM、文生圖、文生視頻、推薦算法等高算力需求,重點支持以快手可靈爲代表的文生視頻模型。公司同步開發類CUDA編程接口,適配PyTorch框架及主流大模型推理引擎,降低客戶遷移成本。
「凌川科技」Transtreams Advanced Compute Unified Architecture 是一種融合 CPU 與 NPU 協同運作的異構運算平臺。它結合傳統 CUDA/OpenCL 優勢,採用由 CPU 負責控制與調度、NPU 處理密集計算的架構,實現高效任務協同與性能優化。其編程框架支持同一套代碼在 CPU 與 NPU 間無縫切換,TC 編譯器可根據負載自動分配任務,提升資源利用與負載平衡。在語言層面,TC 編程語言提供了對張量(Tensor)及其不同層次數據佈局(layout)的統一表示,並抽象出面向 TC NPU 架構的 Tiling 與 Pipeline 機制。語言級封裝使得開發者能夠簡潔、準確地表達複雜的特殊 layout、跨層次 memory(如 DDR、SRAM)的排布,以及多核並行計算中的 Tiling 與流水線調度,從而減少程序開發中的錯誤和複雜性,提高編程效率。同時,運算平臺提供了豐富的系統和應用管理工具,方便用戶能夠更高效地進行靈活的開發、驗證、環境部署及質量監控等。
目前,SL200芯片已覆蓋快手、阿里、百度等互聯網數據中心,並應用在廣播電視、廣電領域、智慧城市、智能巡檢等場景,合作案例超20個。同時,也與華爲、超聚變、浪潮等廠商形成行業解決方案。此外,SL200海外通過快手海外出海業務進入東南亞新加坡、巴西市場。劉凌志透露:“公司下一代芯片已與多家大模型公司完成適配測試,今明年將重點拓展自動駕駛機器人、低空經濟、自動駕駛等機器人與邊緣計算場景。”
團隊方面,「凌川科技」CEO劉凌志爲上海交大博士、華盛頓大學博士後,曾任快手副總裁及華爲、英特爾核心技術管理崗。自拆分至今,團隊規模已增長三倍,成員涵蓋芯片及互聯網行業專業人才。公司研發人員佔比80%以上,70%以上爲碩士學歷,20%以上爲博士學歷,60%的員工具有十年以上從業經驗。團隊累計申請中外專利超百項,涵蓋大模型壓縮、視頻編碼等關鍵技術。團隊核心成員也深度參與NeurIPS’21等國際競賽,並主導多項北京市、上海市“卡脖子”技術攻關項目。