豆包大模型高考評測結果公佈
北京商報訊(記者 魏蔚)6月26日,字節跳動Seed團隊公佈2025高考全科測試結果。該測試採用全國新一卷和山東省自主命題,豆包Seed1.6-Thinking模型的文科和理科成績分別是683分和648分。同期測試的國內外5款頂級模型中,豆包文科成績獲最高分,理科僅次於谷歌Gemini 2.5 Pro,後者成績爲655分。測試結果顯示,豆包的語文、英語、物理、歷史、地理、政治六門學科獲最高分,數學成績超過140分;DeepSeek R1獲得數學最高分145分;Gemini 2.5 Pro以82分獲得化學最高分,並與OpenAI o3一起獲得生物最高分,成績爲77分。
相關資訊
- ▣ 首個AI大模型高考全卷評測結果發佈
- ▣ 智源公佈FlagEval“百模”評測結果
- ▣ 全球140+大模型全方位評測結果出爐,智源評測體系發佈
- ▣ 豆包小範圍測試深度思考模型
- ▣ 字節豆包小範圍測試深度思考模型
- ▣ 永信至誠:公司AI大模型安全測評“數字風洞”平臺已接入抖音豆包大模型
- 中保研公佈2024年測評車型第一次結果
- ▣ 豆包大模型1.5Pro正式發佈
- ▣ 豆包大模型1.5正式發佈
- ▣ 傳豆包正小範圍測試自研深度思考模型
- ▣ 豆包1.5深度思考模型發佈 譚待:豆包日均tokens超12.7萬億
- ▣ 永信至誠:AI大模型安全測評“數字風洞”平臺已接入抖音豆包大模型
- ▣ 豆包視頻生成大模型發佈
- ▣ 豆包大模型推理算力需求測算
- ▣ 《通用大模型評測標準》發佈
- ▣ 出分了!豆包大模型1.6高考成績出爐,直逼“清北”
- ▣ 首個AI高考全卷評測結果發佈:最高分303 數學全不及格
- ▣ 豆包視覺理解模型發佈
- ▣ 國內首個官方大模型評測結果出爐 阿里雲通義千問首批通過評測
- ▣ 字節跳動豆包大模型下週將發佈視頻生成模型
- ▣ 高考作文題目出爐!DeepSeek、豆包、文心等大模型誰寫得好?
- ▣ 從考公、寫週報到下廚指南,晚點評測 18 個大模型
- ▣ 豆包大模型家族全面升級,視覺理解模型重磅發佈
- ▣ 智源發佈智源評測體系 國內外“百模”評估結果出爐
- ▣ 中保研公佈8款車型C-IASI測評結果 豐田表現讓人意外
- ▣ 字節跳動豆包小範圍測試深度思考模型 接入的不是DeepSeek
- ▣ 豆包大模型團隊&港大提出新成果ByteCheckpoint,性能最高優化529.22倍
- ▣ C-IASI發佈9款車型測評結果:豐田、比亞迪、大衆車在列
- ▣ 字節跳動發佈豆包大模型,稱主力模型比行業便宜低99.3%