Google推出升級版 Gemini 2.5 Pro 預覽版

Google今天發佈了 Gemini 2.5 Pro 的“升級預覽版”,並將在未來幾周內全面上市。此版本模型更新基於上個月發佈的 2.5 Pro I/O 版本 (05-06),帶來了編程能力升級。如今,06-05 在 AIDER Polyglot 等基準測試中繼續保持了這種領先優勢,同時在“GPQA 和 Humanity's Last Exam (HLE)”——這些極具挑戰性的基準測試中,評估模型的數學、科學、知識和推理能力——也取得了頂級表現。

與此同時,Google指出,今天 06-05 在“LMArena 上的 Elo 分數躍升 24 分”,達到 1470 分,而在“WebDevArena 上的 Elo 分數躍升 35 分,達到 1443 分”。

在最近幾次模型升級中,一些人注意到編程之外的性能有所下降,尤其是與03-25相比。Google現在正在通過改進“樣式和結構”來解決這一反饋,以便 Gemini 2.5 Pro“能夠通過格式更好的響應更具創造力”。

Gemini 2.5 Pro 模型更新目前仍處於預覽階段,但您可以期待“幾周後”正式發佈併發布穩定版本。它現已通過 Google AI Studio 和 Vertex AI 推送至 Gemini API,開發者能夠根據預算控制成本和延遲(正如2.5 Flash 中引入的那樣)。Gemini 應用今天也將獲得 2.5 Pro 預覽版升級。