夸克技術團隊曝光 1000萬份“志願報告”如何煉成
中經記者 李立 杭州報道
在互聯網大廠激烈爭奪的“AI高考”賽道, 阿里巴巴AI旗艦應用夸克日前公佈了最新戰績。
“截至6月30日14:30,高考出分第8天,夸克累計爲考生和家長生成超1000萬份專業級志願報告。”“1000萬份專業報告由今年推出的志願報告Agent生成,採用了具備‘任務規劃—執行—檢查—反思’能力的深度研究技術。”夸克方面表示。
在業內人士看來,今年全國高考報名人數1335萬人,僅次於歷史峰值。以目前夸克生成1000萬份專業級志願報告數據看,實現了截至目前深度研究的較大規模場景落地。
深度研究(Deep Research)如何應用在高考這樣特殊的垂直賽道,如何進行精準數據蒐集、清洗,降低幻覺率,在C端實現快速爆發,針對外界關注的諸多問題,在硝煙還未散去的“夸克高考作戰室”,夸克算法負責人蔣冠軍、夸克高考志願大模型算法負責人唐亮,日前接受包括《中國經營報》在內的媒體記者採訪,講述了Deep Research應用背後的產品邏輯與技術細節。
作爲阿里巴巴AI旗艦應用,這也是夸克技術團隊一次罕見的低調曝光,夸克的野心遠不止AI高考賽道。
數據壁壘與深度對齊
今年互聯網大廠在“AI高考”賽道上的爭奪尤爲激烈。
此前,記者注意到,騰訊、百度、夸克、知乎等紛紛推出了相關產品。以夸克爲例,2019年開始做高考產品,至今過去七年。今年進一步推出“高考深度搜索”“志願報告”“智能選志願”三個核心功能。作爲“深度研究”技術在垂類場景中的代表應用,志願報告Agent備受關注。
“高考對中國家庭非常重要,與原來其他通用學科圍繞大模型做問答產品有非常差異化的需求。”蔣冠軍接受記者採訪時表示,這就要求高考提供的內容必須專業,必須準確,不能有錯誤信息。
如何讓Agent在5—10分鐘內,像專家一樣,給出準確和讓考生可信、可用的志願報告?準確的數據來源和深度對齊模型訓練尤爲重要。
“在此前的基礎上更重點強調高考專業知識庫的完善。”唐亮透露,“今年夸克總共蒐集了8000多個站點,高考相關權威站點99%以上,大概覆蓋20多億條數據。”
海量數據蒐集背後,分類與整理更爲關鍵。“我們根據不同數據來源進行分級,首先是考試院、教育部、省招辦;其次是高校官網,每個高校數據;再次是像陽光高考、中國教育在線等企業提供的比較專業的數據。”據唐亮介紹,生成答案時,讓模型優先採信最高權威度的信息來源。內部測試顯示,近95%的用戶問題都有權威內容覆蓋。
同時推動大量線下非標文檔的線上化,高校近三年的就業質量報告、本科教學質量報告,以及政府就業報告等,夸克投入了大量人力,將線下非標文檔進行了線上化處理。
“除了事實性數據,志願報告裡的志願信息其實是人工整理。”蔣冠軍透露,“這部分信息絕對不能出錯,比如學校每年會調整專業,通過人工去各個省教育主管部門、各個大學官網進行數據蒐集再校驗。”
“針對高考垂直模型,夸克做了持續訓練和後鏈路整體對齊。”蔣冠軍表示。在執行過程中,Agent通過多輪“工具調用+反思調整”的機制,動態優化志願方案。
例如,當考生表達“傾向留在省內(廣州、深圳優先)、不考慮偏遠地區”時,模型會自動生成搜索指令:優先推薦廣州、深圳的高校,其次考慮廣東省內其他城市院校,排除偏遠地區選項;若優質選項受限,Agent還能主動反思擴展搜索範圍,如增加廣東周邊發達城市,或在高層次高校(如985)上適度放開地域限制,爲考生爭取衝一衝的機會。
此外,Agent具備處理複雜甚至自相矛盾訴求的能力。面對“數學成績差,但想報考計算機”這類常見衝突,系統會觸發“需求澄清”流程,提示用戶這一選擇可能存在的能力匹配問題。這種專家式的思考路徑和策略調整,是傳統工具難以實現的,也是夸克“深度研究”技術真正實現智能化決策的關鍵所在。
據瞭解,在模型訓練階段,夸克算法團隊邀請了上百名資深高考志願規劃師參與,將人類專家的思考過程轉化爲數萬條高質量推理數據。模型產出的志願方案再經過專家多維評估,逐項打分形成反饋閉環。通過持續迭代,模型逐步獲得了“像志願專家一樣思考”的能力。
“根據內部評測,高考垂直模型的幻覺率比通用模型降低了60%—70%。”蔣冠軍透露。
“規模”背後的野心
爲什麼夸克舉公司之力,深耕高考賽道長達七年?
此前有夸克內部人士向記者透露,高考項目對於夸克來說就像淘天的“雙十一”。公司從三個月前就開始準備,程序員集中在“夸克高考作戰室”封閉作戰。
蔣冠軍迴應記者稱:“高考產品體量足夠大,也與誇客最初想做個人助手的初衷非常契合。”在其看來,第一年投入就很堅決,當時市場沒多少人做,只要把市場上比較好的數據和內容做合理整合,就能給用戶提供更好的產品。“持續做下來,夸克高考在市場上形成了不錯的口碑,同時有助於夸克整體業務發展。”
此前夸克高考產品經理郟海峰曾透露:“監測數據顯示,30%的高考老用戶會再次使用夸克。”夸克公開數據顯示,2024年服務了超過3000萬考生和家長等用戶,累計服務超過1.2億人次。其中,50%的用戶是三線城市以下考生。
上述夸克內部人士透露,夸克最早開發高考相關產品,因爲每年此時都是用戶使用峰值,出於用戶需求開發了相關產品,隨後持續升級成AI搜索。從目前看,提早佈局高考市場,爲夸克持續保持年輕用戶增長打開了入口,三線城市以下城市佔比50%,亦成爲進軍下沉市場的切入點。
夸克第一次出現在阿里巴巴財報中是2023年。據財報披露數據,2023年9月,夸克DAU(日活躍用戶)同比增超35%。
蔣冠軍此前披露,夸克平臺25歲以下用戶人羣佔比超過50%。另據易觀千帆《2025年AI產業發展十大趨勢》披露的數據,夸克24歲以下的年輕人佔比逼近50%。
值得注意的是,年輕用戶與下沉市場的佔比,讓夸克在阿里巴巴持續佈局AI的核心戰略中,位置越來越微妙。
2023年12月,散發技術氣息的夸克,以“阿里四小龍”之一出道。2025年3月,夸克升級“AI超級框”,阿里巴巴對夸克的新定義是AI旗艦應用。夸克更是將品牌Slogan定義爲“2億人的AI全能助手”。夸克的定位由此變成集AI搜索、AI教育、AI寫作、AI總結、AI搜題、AI網盤以及AI掃描等功能的“AI全能智能助手”。
阿里巴巴觀察人士認爲,字節跳動、百度等大廠都在加速佈局To C的AI應用,手握年輕用戶且在持續增長的夸克,有望在AI時代爲阿里巴巴贏得船票。
“夸克團隊從做搜索引擎開始,2018年AI技術剛開始發展,就想把夸克做成一個類似個人助手的產品。”回憶夸克迭代之路時蔣冠軍表示,“大模型出現時我們非常興奮,與此前我們想把夸克做成個人助手的初衷完美契合。可以說,夸克是非常受益大模型發展的產品或助手工具。”
“團隊是做搜索引擎和工具出身,比較低調,這種特質反饋到產品上就是嚴謹與剋制。”據蔣冠軍透露,除了高考之外,在醫療、教育等對準確度要求較高的垂直賽道上,夸克也在持續深入探索中。
(編輯:吳清 審覈:李正豪 校對:張國剛)