為打造更聰明AI模型…業者砸重金延攬專才!加速捨棄聘請低薪標註員

AI集團爲加強資料品質,正從各產業延攬專業人才。路透

頂尖的人工智慧(AI)集團正以高薪延攬產業專家,取代在非洲、亞洲的低薪資料標註員,力圖打造更聰明、更強大的AI模型。

英國金融時報(FT)報導,Scale AI、Turing、Toloka正聘請生物、金融等領域的一流專家,以生成對催生次世代AI系統至關緊要的複雜訓練資料。

OpenAI的o3、Google旗下Gemini 2.5等推理模型的崛起,已使業者加速捨棄在肯亞、菲律賓等國家聘請數千名低薪員工的作法;這類人力從事註記資料集的耗時工作,時薪低於2美元。

Toloka共同創辦人、執行長梅戈爾斯卡雅說:「AI產業長久以來偏重於模型與運算,向來忽略資料這一環節。」「業界總算正視訓練資料的重要性。」

這項轉變促使投資人燃起對資料辨識新創業者的興趣。爲追趕對手,Meta在6月對美國的Scale AI投資150億美元,使該公司的估值倍增至290億美元。

在3月,加州的Turing AI籌得1.11億美元,把估值推升至22億美元。亞馬遜創辦人貝佐斯的私人事業Bezos Expeditions在5月引領了對Toloka的7,200萬美元融資。

在這之前,資料標註員負責簡單的工作,例如在圖片上畫框以辨識物品、描述圖片內容、選擇流暢的表達方式、並移除資料集中時常含有暴力或露骨內容的糟糕答覆。梅戈爾斯卡雅說,如今,這類任務的需求已大幅下降,因爲許多工作已能自動化處理。

爲了確保模型在程式設計、物理學與金融等各領域都有良好表現,財力雄厚的AI企業如今願意出高價,購買更復雜的資料集,並從全球延攬專家。

Turing AI共同創辦人、執行長席達哈指出,爲了吸引來自不同產業的人才,開給專家的報酬,比他們原先的工作高出20%–30%。相較於AI公司在算力砸下數千億美元,資料支出僅佔其中約10%到15%,但這仍是一筆「極其龐大」的費用。

Toloka的梅戈爾斯卡雅表示,「思維鏈(chain-of-thought)」是AI模型一步步解題的過程,這類新功能與能力,是透過人類專家示範如何拆解問題所開發出來的。