☰

OpenAI深夜發佈"超級智能體"，AI"打工人"時代降臨！

7月18日凌晨，OpenAI宣佈推出“ChatGPT智能體”功能，該功能允許其AI聊天機器人使用自己的虛擬計算機，自主地爲人類用戶瀏覽網頁、進行廣泛研究、下載和創建新文件。

OpenAI深夜發佈"超級智能體"（來源：本站科技報道）

簡而言之，ChatGPT現在擁有了“自己的個人電腦”，並且可以利用這臺虛擬計算機登錄用戶的賬戶，以下載或發送內容。OpenAI解釋道：“至少在虛擬層面上，AI模型可以選擇使用文本瀏覽器或視覺瀏覽器打開網頁，下載文件，通過終端運行命令進行處理，並通過視覺瀏覽器查看輸出結果。模型會根據任務來自適應地調整策略，以快速、精準和高效地完成任務。”

深度集成第三方服務，提升用戶體驗

用戶可以通過點擊ChatGPT提示輸入框中的“工具”按鈕，打開下拉菜單，並從可用選項中選擇“智能體模式”來啓用該智能體。

開啓後，用戶只需要用自然語言描述任務，智能體便能跨越網頁和本地應用環境執行相關操作。這使得推理能力與以往需要人工手動完成的操作相結合，用戶無需親自處理繁瑣事務。

ChatGPT智能體能夠連接到個人或企業Gmail、GitHub等應用，幫助用戶提取有用信息（如電子郵件或代碼），並完成指定任務。它還可以通過已連接的第三方應用程序接口（API）獲取信息並利用相關服務。

如果網站需要登錄，用戶可以通過一種安全的瀏覽器視圖完成此操作，從而使智能體能夠執行更深入的任務，如檢查收件箱或代爲填寫表單。

據OpenAI的ChatGPT智能體產品負責人尼爾·阿加拉普（Neel Ajjarapu）指出：“我們的模型在基礎財務分析任務中表現尤爲出色。這類工作通常需要初級員工熬夜完成，特別是當遇到上司臨時下達的緊急任務時。”

簡單易用，突破“Operator”侷限

新的ChatGPT智能體是在OpenAI於2025年1月推出的“Operator”智能體的基礎上進行改進和擴展的。Operator智能體曾允許ChatGPT瀏覽網頁、填寫表單、下訂單等，然而，Operator僅限於與網站和基於Web的應用程序進行交互，而不能與那些也可以在個人電腦上本地運行的程序（如Excel或PPT製作軟件）進行交互。

現在，ChatGPT智能體不但可以瀏覽網站、與在線表單交互，還能運行代碼、分析數據，並根據用戶的指示生成最終的輸出文件，如可編輯的PPT或Excel——這一切都能通過簡單的指令完成。

融合“Operator”和“深度研究”優勢

事實上，ChatGPT智能體結合了OpenAI之前發佈的“Operator”和“深度研究”兩大智能體的優點。“深度研究”於2025年2月推出，能夠通過其專有的無頭文本瀏覽器進行深入的網絡搜索，並編寫詳細報告。

OpenAI在其博客中指出：“Operator無法進行深度分析或撰寫詳細報告，而‘深度研究’則不能與網站交互以細化結果或訪問需要身份驗證的內容。實際上，我們發現，很多通過Operator提出的查詢，其實更適合用‘深度研究’來處理，因此我們將兩者的優勢融爲一體。”

原有的Operator工具將被淘汰，但用戶仍可以通過ChatGPT界面的下拉菜單訪問“深度研究”功能。

一套系統，多種工具，全面支持各類應用

無論是使用視覺瀏覽器瀏覽網站，還是通過終端運行Python代碼，ChatGPT智能體都可以在同一會話中無縫切換不同工具。它支持各種應用場景，包括競爭分析、報告生成、旅行規劃、郵件摘要及預約管理等。

用戶可以隨時中斷、重定向或暫停任務，智能體會從中斷的地方繼續執行操作。

從今天開始，ChatGPT每月200美元“Pro”級別的訂閱者將可以完全訪問ChatGPT智能體，每月配額爲400條消息。

“ChatGPT Plus”（每月20美元）和“Team”（每月30美元）的用戶將在接下來的幾天內獲得訪問權限，每月配額40條消息。企業版和教育版用戶則需等待幾周時間。此功能目前尚未在歐洲和瑞士推出。

強化安全與控制，確保用戶安全

鑑於ChatGPT智能體現在能夠代表用戶執行操作，包括在已登錄的網站或已連接的應用上進行操作，OpenAI特別加強了安全保護措施。

這些安全措施包括：在執行操作之前要求用戶確認、對敏感任務進行主動監督，以及設置技術性保障以限制意外行爲的發生。

關鍵的安全保護措施包括：

加強對高風險領域的保護，確保用戶隱私和數據安全

根據OpenAI的《準備框架》，ChatGPT智能體被歸類爲生物與化學領域中的“高能力系統”。雖然目前沒有直接證據表明它會被濫用，但OpenAI依然激活了最強的安全保護措施，以防萬一。

這些措施包括增強的拒絕訓練、由生物安全專家進行的“紅隊”測試以及改進的檢測系統。

此前，OpenAI的勁敵Anthropic發佈的Claude Opus 4等模型的資料，以及其他關於先進AI模型的調查顯示，當AI系統獲得訪問外部工具和應用（如電子郵件）的權限時，在某些情況下，它們可能會採取其自認爲道德和合乎倫理的行動，但實際上可能會危及用戶的隱私、安全和專有信息。例如，它可能會向政府機構或記者發送電子郵件，舉報用戶涉嫌的不當行爲。

模型認爲自己像一個“告密者”一樣行事，但實際上，可能會損害用戶的隱私、安全和專有信息，並向當局報告不存在的不當行爲，或者只是可疑的行爲。

簡化工作流程，或與微軟直接競爭

ChatGPT智能體能夠創建PPT演示文稿和詳細的Excel草稿，之後用戶可以使用Microsoft Office或其他兼容軟件對其進行編輯。OpenAI指出，相較於其他功能，這一功能更具創新性，有助於大幅減少用戶在製作PPT和分析報告時所需的時間，將通常需要幾個小時或幾天的工作縮短到三十分鐘內。

儘管如此，ChatGPT智能體功能使OpenAI在某種程度上直接與商業軟件巨頭微軟展開競爭，這可能加劇兩家公司之間的緊張關係，畢竟雙方的競爭已逐漸升溫。

微軟也推出了類似的AI智能體，幫助用戶創建和編輯PPT演示文稿和Excel電子表格。其他公司也推出了旨在簡化PPT和報告製作過程的AI智能體。

OpenAI表示，ChatGPT智能體暫不支持谷歌的Slides和Sheets，二者是谷歌與微軟Excel和PPT競爭的產品。

實測性能亮眼，但仍存侷限

ChatGPT智能體不僅在理論上表現出色，在實際測試中也達到了很高的水平。在“人類終極考試”中，它通過並行部署方法取得了44.4的高分；在“FrontierMath”基準測試中，準確率達到了27.4%。

在“SpreadsheetBench”基準測試中，ChatGPT智能體得分爲45.5%，是Excel中Copilot性能的兩倍多。

目前，ChatGPT智能體的部分功能（如幻燈片生成）仍在測試階段，可能在格式上存在一定差異，或者在應用內預覽和導出文件之間有所不同。OpenAI正在積極訓練其下一代版本，以提高該功能的完善度和佈局。

ChatGPT智能體的推出，標誌着用戶與AI互動方式的一次範式轉變——從單純提問到全權任務委託。

憑藉其強大的推理、執行和交付成果的能力，OpenAI相信，用戶越來越希望AI不僅僅是一個輔助工具，而是一個能夠爲其工作、幫助解決實際問題的助手。雖然這一智能體功能仍在不斷髮展中，但OpenAI將此次發佈視爲構建未來互動性更強、更注重行動的AI的基礎。（小小）

OpenAI深夜發佈"超級智能體"，AI"打工人"時代降臨！

相關資訊