OpenAI深夜發佈"超級智能體",AI"打工人"時代降臨!
7月18日凌晨,OpenAI宣佈推出“ChatGPT智能體”功能,該功能允許其AI聊天機器人使用自己的虛擬計算機,自主地爲人類用戶瀏覽網頁、進行廣泛研究、下載和創建新文件。
OpenAI深夜發佈"超級智能體"(來源:本站科技報道)
簡而言之,ChatGPT現在擁有了“自己的個人電腦”,並且可以利用這臺虛擬計算機登錄用戶的賬戶,以下載或發送內容。OpenAI解釋道:“至少在虛擬層面上,AI模型可以選擇使用文本瀏覽器或視覺瀏覽器打開網頁,下載文件,通過終端運行命令進行處理,並通過視覺瀏覽器查看輸出結果。模型會根據任務來自適應地調整策略,以快速、精準和高效地完成任務。”
深度集成第三方服務,提升用戶體驗
用戶可以通過點擊ChatGPT提示輸入框中的“工具”按鈕,打開下拉菜單,並從可用選項中選擇“智能體模式”來啓用該智能體。
開啓後,用戶只需要用自然語言描述任務,智能體便能跨越網頁和本地應用環境執行相關操作。這使得推理能力與以往需要人工手動完成的操作相結合,用戶無需親自處理繁瑣事務。
ChatGPT智能體能夠連接到個人或企業Gmail、GitHub等應用,幫助用戶提取有用信息(如電子郵件或代碼),並完成指定任務。它還可以通過已連接的第三方應用程序接口(API)獲取信息並利用相關服務。
如果網站需要登錄,用戶可以通過一種安全的瀏覽器視圖完成此操作,從而使智能體能夠執行更深入的任務,如檢查收件箱或代爲填寫表單。
據OpenAI的ChatGPT智能體產品負責人尼爾·阿加拉普(Neel Ajjarapu)指出:“我們的模型在基礎財務分析任務中表現尤爲出色。這類工作通常需要初級員工熬夜完成,特別是當遇到上司臨時下達的緊急任務時。”
簡單易用,突破“Operator”侷限
新的ChatGPT智能體是在OpenAI於2025年1月推出的“Operator”智能體的基礎上進行改進和擴展的。Operator智能體曾允許ChatGPT瀏覽網頁、填寫表單、下訂單等,然而,Operator僅限於與網站和基於Web的應用程序進行交互,而不能與那些也可以在個人電腦上本地運行的程序(如Excel或PPT製作軟件)進行交互。
現在,ChatGPT智能體不但可以瀏覽網站、與在線表單交互,還能運行代碼、分析數據,並根據用戶的指示生成最終的輸出文件,如可編輯的PPT或Excel——這一切都能通過簡單的指令完成。
融合“Operator”和“深度研究”優勢
事實上,ChatGPT智能體結合了OpenAI之前發佈的“Operator”和“深度研究”兩大智能體的優點。“深度研究”於2025年2月推出,能夠通過其專有的無頭文本瀏覽器進行深入的網絡搜索,並編寫詳細報告。
OpenAI在其博客中指出:“Operator無法進行深度分析或撰寫詳細報告,而‘深度研究’則不能與網站交互以細化結果或訪問需要身份驗證的內容。實際上,我們發現,很多通過Operator提出的查詢,其實更適合用‘深度研究’來處理,因此我們將兩者的優勢融爲一體。”
原有的Operator工具將被淘汰,但用戶仍可以通過ChatGPT界面的下拉菜單訪問“深度研究”功能。
一套系統,多種工具,全面支持各類應用
無論是使用視覺瀏覽器瀏覽網站,還是通過終端運行Python代碼,ChatGPT智能體都可以在同一會話中無縫切換不同工具。它支持各種應用場景,包括競爭分析、報告生成、旅行規劃、郵件摘要及預約管理等。
用戶可以隨時中斷、重定向或暫停任務,智能體會從中斷的地方繼續執行操作。
從今天開始,ChatGPT每月200美元“Pro”級別的訂閱者將可以完全訪問ChatGPT智能體,每月配額爲400條消息。
“ChatGPT Plus”(每月20美元)和“Team”(每月30美元)的用戶將在接下來的幾天內獲得訪問權限,每月配額40條消息。企業版和教育版用戶則需等待幾周時間。此功能目前尚未在歐洲和瑞士推出。
強化安全與控制,確保用戶安全
鑑於ChatGPT智能體現在能夠代表用戶執行操作,包括在已登錄的網站或已連接的應用上進行操作,OpenAI特別加強了安全保護措施。
這些安全措施包括:在執行操作之前要求用戶確認、對敏感任務進行主動監督,以及設置技術性保障以限制意外行爲的發生。
關鍵的安全保護措施包括:
加強對高風險領域的保護,確保用戶隱私和數據安全
根據OpenAI的《準備框架》,ChatGPT智能體被歸類爲生物與化學領域中的“高能力系統”。雖然目前沒有直接證據表明它會被濫用,但OpenAI依然激活了最強的安全保護措施,以防萬一。
這些措施包括增強的拒絕訓練、由生物安全專家進行的“紅隊”測試以及改進的檢測系統。
此前,OpenAI的勁敵Anthropic發佈的Claude Opus 4等模型的資料,以及其他關於先進AI模型的調查顯示,當AI系統獲得訪問外部工具和應用(如電子郵件)的權限時,在某些情況下,它們可能會採取其自認爲道德和合乎倫理的行動,但實際上可能會危及用戶的隱私、安全和專有信息。例如,它可能會向政府機構或記者發送電子郵件,舉報用戶涉嫌的不當行爲。
模型認爲自己像一個“告密者”一樣行事,但實際上,可能會損害用戶的隱私、安全和專有信息,並向當局報告不存在的不當行爲,或者只是可疑的行爲。
簡化工作流程,或與微軟直接競爭
ChatGPT智能體能夠創建PPT演示文稿和詳細的Excel草稿,之後用戶可以使用Microsoft Office或其他兼容軟件對其進行編輯。OpenAI指出,相較於其他功能,這一功能更具創新性,有助於大幅減少用戶在製作PPT和分析報告時所需的時間,將通常需要幾個小時或幾天的工作縮短到三十分鐘內。
儘管如此,ChatGPT智能體功能使OpenAI在某種程度上直接與商業軟件巨頭微軟展開競爭,這可能加劇兩家公司之間的緊張關係,畢竟雙方的競爭已逐漸升溫。
微軟也推出了類似的AI智能體,幫助用戶創建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡化PPT和報告製作過程的AI智能體。
OpenAI表示,ChatGPT智能體暫不支持谷歌的Slides和Sheets,二者是谷歌與微軟Excel和PPT競爭的產品。
實測性能亮眼,但仍存侷限
ChatGPT智能體不僅在理論上表現出色,在實際測試中也達到了很高的水平。在“人類終極考試”中,它通過並行部署方法取得了44.4的高分;在“FrontierMath”基準測試中,準確率達到了27.4%。
在“SpreadsheetBench”基準測試中,ChatGPT智能體得分爲45.5%,是Excel中Copilot性能的兩倍多。
目前,ChatGPT智能體的部分功能(如幻燈片生成)仍在測試階段,可能在格式上存在一定差異,或者在應用內預覽和導出文件之間有所不同。OpenAI正在積極訓練其下一代版本,以提高該功能的完善度和佈局。
ChatGPT智能體的推出,標誌着用戶與AI互動方式的一次範式轉變——從單純提問到全權任務委託。
憑藉其強大的推理、執行和交付成果的能力,OpenAI相信,用戶越來越希望AI不僅僅是一個輔助工具,而是一個能夠爲其工作、幫助解決實際問題的助手。雖然這一智能體功能仍在不斷髮展中,但OpenAI將此次發佈視爲構建未來互動性更強、更注重行動的AI的基礎。(小小)