7個數據標註基地已建設數據集524個
本報北京7月22日電(記者王雲杉)記者從國家數據局獲悉:國家數據局指導合肥、成都等7個城市建設數據標註基地,先行先試探索數據標註產業發展經驗,截至今年上半年,7個數據標註基地建設數據集524個,服務大模型163個。
高質量數據集是經過採集、加工等數據處理,可以直接用於開發和訓練人工智能模型,能夠有效地提升模型性能的高質量數據集合。
據瞭解,國家數據局着力構建“部門協同、央地聯動”的工作機制,全面加速高質量數據集建設和應用落地,組織開展生態培育專項行動,主要包括三個方面:一是組織開展高質量數據集典型案例徵集和示範推廣,挖掘醫療、工業、交通等重點領域標杆實踐;二是定期舉辦技術交流活動,圍繞數據標註、合成、高質量數據集建設方法論等開展深度研討;三是搭建常態化供需對接平臺,促進數據供給方、技術提供方、場景應用方精準匹配。