谷歌(GOOGL.US)AI殺入“分“時代,Gemini三箭齊發對決OpenAI
智通財經APP獲悉,谷歌(GOOGL.US)於週三正式向所有人發佈了其“最強大”的人工智能模型套件——Gemini 2.0。這一全面發佈的模型套件包括三個核心版本:2.0 Flash、2.0 Pro Experimental 和 2.0 Flash-Lite。其中,2.0 Flash 是“主力模型”,適用於大規模高容量、高頻率任務;2.0 Pro Experimental 專注於提升編程性能,支持200萬tokens的輸入容量;而2.0 Flash-Lite 則是谷歌稱作“迄今爲止最具成本效益的模型”,每百萬tokens處理成本僅爲0.75美分,相比2.0 Flash 的10美分更具性價比。
此次發佈是谷歌在人工智能代理領域的重要佈局。人工智能代理能夠代表用戶自動完成複雜的多步驟任務,而無需用戶逐步指導。谷歌在去年12月的博客文章中提到,Gemini 2.0 在多模態能力方面取得了新進展,支持文本、圖像和音頻等多種數據類型,並具備原生工具調用能力。這些特性使該模型系列更接近“通用型數字助手”的願景。
與此同時,科技巨頭和初創公司之間的人工智能軍備競賽正在加劇。Meta(META.US)、亞馬遜(AMZN.US)、微軟(MFT.US)、OpenAI 和 Anthropic 等公司都在加速開發類似的人工智能代理系統。
例如,Anthropic 在去年10月宣佈其智能體能夠像人類一樣使用計算機完成複雜任務。據瞭解,Anthropic 是一家由前 OpenAI 研究主管創立的人工智能初創公司,得到了亞馬遜的支持,已成爲開發人工智能代理領域的重要競爭力量。
這家初創公司表示,Anthropic 的技術通過其強大的計算機使用能力,能夠解釋計算機屏幕上的內容、選擇按鈕、輸入文本、瀏覽網站,並通過任何軟件和實時互聯網執行復雜任務。
Anthropic 首席科學官賈裡德·卡普蘭(Jared Kaplan)在接受採訪時表示,該工具“基本上能夠像人類一樣使用計算機”,並強調它可以完成涉及“數十甚至數百個步驟”的複雜任務。
與此同時,OpenAI 最近推出了一項名爲 Operator 的功能,該功能能夠自動執行一系列複雜任務,例如計劃假期、填寫表格、預訂餐廳以及訂購雜貨。這家由微軟支持的初創公司將 Operator 描述爲“一個能夠上網爲您執行任務的智能代理”。
本週早些時候,OpenAI 進一步拓展了其技術邊界,推出了 Deep Research。這項新功能允許 AI 代理編寫複雜的研究報告,並分析用戶選擇的問題和主題。值得注意的是,谷歌在去年 12 月也推出了一款同名的工具——Deep Research,它被設計爲一個“研究助手”,能夠探索複雜主題並代表用戶編寫報告。
谷歌計劃在2025年初推出更多人工智能功能,其首席執行官桑達爾·皮查伊 (Sundar Pichai) 在當時的戰略會議上表示:“從歷史上看,你並不一定總是第一個進入市場,但關鍵在於執行力——真正成爲同類產品中最好的。我認爲,這正是 2025 年對我們而言最重要的意義所在。”
本文源自:智通財經網