科大訊飛領跑通用大模型評測體系2.0升級
6月24日,《通用大模型評測體系2.0》正式亮相。作爲國內大模型評測的權威標準,此次升級以技術迭代與產業需求爲核心,在評測維度擴展、專項能力深化、評測方法優化等方面實現了全面突破,爲中國大模型產業發展提供了更爲科學、精準的標準化支撐,其含金量不言而喻。
相較於1.0版本,評測體系2.0的任務規模擴展至1186項,首次實現文本、圖片、語音、視頻的全模態覆蓋,新增多模理解、多模生成及語音交互等能力評測。放眼國內大模型領域,能達到此評測標準的大模型廠商可謂鳳毛麟角,而科大訊飛便是其中的佼佼者。訊飛在大模型行業深耕多年,憑藉深厚的技術積累與豐富的專業場景實踐,在多個領域取得了令人矚目的成就
科大訊飛的語音識別、合成技術長期領先國際,科大訊飛的多模態人機交互系統已廣泛應用於教育、醫療等領域,爲評測體系的模態擴展提供了關鍵支撐。在行業賦能層面,科大訊飛智慧教育解決方案已覆蓋全國5萬所學校,科大訊飛的AI備課、個性化學習等場景能力通過評測驗證,進一步推動因材施教與教學質量評估的產業化落地。值得一提的是,訊飛星火大模型在不斷升級迭代中展現出強大的實力。星火 X1 升級之後,在多模理解、多模生成、語音交互、深度推理等方面的能力顯著提升。
科大訊飛憑藉在專業場景的深厚積累以及大模型技術的卓越表現,與《通用大模型評測體系 2.0》的各項要求高度契合。未來,科大訊飛將繼續發揮自身優勢,推動中國大模型從通用能力競爭邁向專業化、場景化價值創造的新階段,爲全球 AI 發展貢獻更多“訊飛智慧”與“訊飛方案”。