☰

36氪首發 | 從快手獨立的AI芯片公司融資數億元，視頻壓縮性能超英偉達

作者 | 林晴晴

編輯 | 彭孝秋

36氪獲悉，人工智能芯片企業「凌川科技」近日完成數億元A輪融資，由北京市人工智能產業投資基金和快手集團領投，亦莊產投、順禧基金、九智資本等跟投。本輪融資將主要用於下一代芯片研發、現有產品SL200的量產擴產及海外市場拓展。

「凌川科技」成立於2024年3月，由北京市人工智能基金與快手集團共同發起，前身爲快手集團異構計算與芯片事業部。「凌川科技」CEO劉凌志告訴36氪，“2018年快手日活破億，傳統堆算力服務器的成本壓力已不可持續。我們從異構計算平臺切入，2020年正式立項芯片，2023年SL200在快手部署數萬顆，節省超預期成本後，拆分獨立成爲必然選擇。”

目前，SL200芯片集成了視頻編碼、AI推理、多核CPU等核心功能，部署量近數萬顆，服務7億用戶，並獲評2023世界互聯網大會“創新發展典型案例”。劉凌志強調：“互聯網基因讓我們從應用反推芯片設計，客戶需求直接定義產品，這是傳統芯片公司難以複製的優勢。”

目前，全球AI芯片市場長期由英偉達主導，其CUDA生態形成技術壁壘，但大模型推理場景對成本與能效的敏感度催生了ASIC架構的差異化需求。國內智能視頻賽道高速增長，涌現快手、字節跳動等頭部應用及“可靈”“即夢”等大模型技術，但算力芯片仍面臨美國出口限制的“卡脖子”風險。「凌川科技」瞄準垂直領域，通過ASIC架構降低推理成本，單顆芯片可處理36路視頻任務，較傳統方案節能30%，成爲國產替代的關鍵路徑。

36氪瞭解到，SL200芯片爲國內首款集成視頻編碼、AI推理、多核CPU等功能的ASIC芯片，支持萬分之一超低故障率，頭部客戶直播覆蓋率近100%。其視頻壓縮性能在MSU大賽中超越英特爾、英偉達，單路處理成本降低40%。下一代芯片針對大模型訓練推理場景設計，支持LLM、文生圖、文生視頻、推薦算法等高算力需求，重點支持以快手可靈爲代表的文生視頻模型。公司同步開發類CUDA編程接口，適配PyTorch框架及主流大模型推理引擎，降低客戶遷移成本。

「凌川科技」Transtreams Advanced Compute Unified Architecture 是一種融合 CPU 與 NPU 協同運作的異構運算平臺。它結合傳統 CUDA/OpenCL 優勢，採用由 CPU 負責控制與調度、NPU 處理密集計算的架構，實現高效任務協同與性能優化。其編程框架支持同一套代碼在 CPU 與 NPU 間無縫切換，TC 編譯器可根據負載自動分配任務，提升資源利用與負載平衡。在語言層面，TC 編程語言提供了對張量（Tensor）及其不同層次數據佈局（layout）的統一表示，並抽象出面向 TC NPU 架構的 Tiling 與 Pipeline 機制。語言級封裝使得開發者能夠簡潔、準確地表達複雜的特殊 layout、跨層次 memory（如 DDR、SRAM）的排布，以及多核並行計算中的 Tiling 與流水線調度，從而減少程序開發中的錯誤和複雜性，提高編程效率。同時，運算平臺提供了豐富的系統和應用管理工具，方便用戶能夠更高效地進行靈活的開發、驗證、環境部署及質量監控等。

目前，SL200芯片已覆蓋快手、阿里、百度等互聯網數據中心，並應用在廣播電視、廣電領域、智慧城市、智能巡檢等場景，合作案例超20個。同時，也與華爲、超聚變、浪潮等廠商形成行業解決方案。此外，SL200海外通過快手海外出海業務進入東南亞新加坡、巴西市場。劉凌志透露：“公司下一代芯片已與多家大模型公司完成適配測試，今明年將重點拓展自動駕駛機器人、低空經濟、自動駕駛等機器人與邊緣計算場景。”

團隊方面，「凌川科技」CEO劉凌志爲上海交大博士、華盛頓大學博士後，曾任快手副總裁及華爲、英特爾核心技術管理崗。自拆分至今，團隊規模已增長三倍，成員涵蓋芯片及互聯網行業專業人才。公司研發人員佔比80%以上，70%以上爲碩士學歷，20%以上爲博士學歷，60%的員工具有十年以上從業經驗。團隊累計申請中外專利超百項，涵蓋大模型壓縮、視頻編碼等關鍵技術。團隊核心成員也深度參與NeurIPS’21等國際競賽，並主導多項北京市、上海市“卡脖子”技術攻關項目。

36氪首發 | 從快手獨立的AI芯片公司融資數億元，視頻壓縮性能超英偉達

相關資訊