紅杉中國發布xbench,首個由投資機構打造的AI基準測試
5月26日,紅杉中國宣佈推出全新的AI基準測試xbench,併發布論文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。據悉,這是首個由投資機構發起,聯合國內外十餘家頂尖高校和研究機構的數十位博士研究生,採用雙軌評估體系和長青評估機制的AI基準測試。xbench將在評估和推動AI系統能力提升上限與技術邊界的同時,重點量化AI系統在真實場景的效用價值,並長期捕捉Agent產品的關鍵突破。
相關資訊
- ▣ 紅杉中國大動作!發佈全新AI基準測試工具xbench,意義幾何?
- ▣ 紅杉資本妮重組投資架構:成立紅杉基金
- ▣ 紅杉投資的這家公司押注AI面試
- ▣ AMD首發MLPerf基準測試 展現AI領先地位
- ▣ 首個由中國牽頭完成的ISO旅遊國際標準發佈
- ▣ OpenAI資助AI數學基準測試引發公正性質疑
- ▣ 鄉村基赴港IPO,紅杉中國參與投資
- 國發基金「中東歐投資基金」 臺杉投資受託管理
- ▣ 監測機構EPFR發佈的數據顯示 中國股票基金連續十週獲資金流入
- ▣ 醫藥主題基金淨值回升,機構瞄準AI醫療投資機會
- ▣ 紅杉資本掌門人退休,紅杉中國繼續由他執掌
- Akrapovič打造「騎車機器人」 蠍子管開發測試更精準
- ▣ 紅杉中國募集新基金投資科技初創企業
- 中國市場選擇太少 去年從紅杉資本分拆的紅杉中國正設法向外部投資
- ▣ 總投資超700億元 中國(安徽)自由貿易試驗區首批項目清單發佈
- ▣ 全球頂級投資機構紅杉資本裁員 已獲官方證實
- ▣ 鵬鷂環保接待4家機構調研,包括寧電投資、紅杉資本、長盛基金等
- ▣ 我國首個跨省域政府覈准投資項目目錄發佈
- ▣ 外資機構新發中國股票基金 看好A股長期投資機會
- ▣ Nvidia的新開源AI模型在基準測試中擊敗了GPT-4o
- ▣ AI週報|谷歌發佈AI手機挑戰蘋果;馬斯克的xAI發佈Grok-2 測試版
- ▣ 紅杉資本首次太空投資:SpaceX 後的新動作
- AI性能基準測試從此有了「中國標準」!英偉達、谷歌可以試試這套算力卷
- ▣ 紅杉資本公佈全球前50大AI公司,但不見中國企業;蘋果首款AI PC芯片將於6月發佈|鈦媒體AGI
- ▣ 多家外資機構發佈2025年投資展望,紛紛看多中國資產
- 投資機構預測常失準 謝金河:投機總是會到終點!
- ▣ 國網山東電科院編制的全國首個供熱機組在線監測地方標準發佈
- ▣ 多隻提前佈局AI基金淨值大漲 機構稱AI或爲今年投資主線
- ▣ 首箇中國牽頭完成的ISO旅遊國際標準發佈