字節正尋求供應商以滿足AI數據標註需求 數據標註產業有望快速發展

據字節跳動採購部消息,爲滿足快速增長的AI數據標註需求,抖音集團內容質量與數據服務平臺擬尋找標註供應商,尤其是垂類資源豐富的供應商(如醫療、法律、教育等)。

AI數據標註是對原始數據,如圖片、語音、文本、視頻等進行篩選、清洗、分類、註釋並添加標籤的過程,旨在將非結構化數據轉化爲結構化數據,以便機器學習和人工智能模型能夠理解和學習。數據如同AI發展的燃料,是AI技術前進的基石。大量高質量的標註數據能夠提升AI模型的準確性、泛化能力和性能表現。山西證券指出,隨着首個國家層面的系統性規劃文件出臺,數據標註產業有望迎來快速發展,並將顯著提升數據供給質量,從而解決制約國內人工智能產業發展的高質量數據短缺問題,關注在數據標註領域具有技術優勢和場景落地經驗的廠商。

據財聯社主題庫顯示,相關上市公司中:

法本信息在人工智能領域,提供了OCR、視覺、語音、知識圖譜、數據標註等功能。公司與字節的合作內容包括數據標註、採集服務、ITO外包服務、財經類解決方案項目、互娛開發解決方案項目等等。

中科江南研發的數據標籤系統已在財政、金融、國資監管等業務中應用,爲客戶提供數據標註服務。