專訪微軟首席技術官:微軟積極推動智能代理技術,智能體將普及到各個領域

微軟首席技術官Kevin Scott擁有超過四十年的編程經驗,見證並參與了現代軟件開發歷次關鍵技術革命。作爲下一代互聯網的重要技術方向之一,微軟高度重視智能體技術,幾乎在其所有產品線中都集成了相關功能,推動智能體的廣泛應用和發展。

微軟目前是全球智能體領域的領先者之一,也是最大的智能體開發平臺。全球有超過七萬家企業和數字原生公司通過微軟的Azure AI Foundry平臺,進行智能體及人工智能應用的開發、定製和管理。同時,有超過一萬家機構採用微軟的新Agent Service,進行智能體系統的構建、部署與擴展。包括90%的財富500強企業在內,超過23萬家機構使用Microsoft Copilot Studio來開發人工智能和智能體應用。

在今年的“Build 2025”大會上,Kevin Scott接受了科技博主Every的採訪,深度解析了微軟如何從技術層面促進智能體生態系統的發展,同時分享了微軟在技術創新和標準建設方面的實踐經驗。

完整專訪視頻

以下是對採訪內容的重新整理:

主持人向Kevin Scott提問,詢問他對利用Agent進行編程的看法,並提到有人擔心這種方式可能削弱編程的樂趣和工匠精神。Kevin表示,他特別欣賞熱愛自己工作的人,無論是軟件工程師、機械工程師還是手工藝者。真正熱情於工作的專業人士都會對如何完成任務有自己的獨到見解。Kevin自己從事木工的時間幾乎和編程時間一樣長。他指出,軟件開發的性質在過去幾十年中多次經歷重大變革,而Agent的價值在於能夠代表用戶執行操作、使用工具、修改系統並訪問各種信息源。爲了實現這一點,需要一個類似互聯網的生態系統,並且微軟內部正努力推動其系統之間基於統一的Agent標準協議進行通信。Kevin鼓勵保持好奇心,勇於嘗試新技術,實用則用,不適合則棄。

主持人接着談到去年Kevin提及的兩個重點——Agent無處不在以及規模定律的持續重要性。今年的主題則轉向了“Agent網絡”,詢問這一轉變背後的原因和行業的收穫。Kevin認爲,過去一年間,人們對規模定律的懷疑逐漸消散,事實證明其長期有效,現已成爲共識。與此同時,模型的推理能力已經超出當前應用範疇,出現了“能力過剩”的現象,這要求業界共同努力,縮小模型實際能力和用戶可用能力之間的差距,因此今年Build大會減少了對規模定律的強調。

此外,隨着各類Agent的大量涌現,行業也意識到除了推理能力,Agent要真正發揮價值,還需解決其他關鍵問題,例如更完善的記憶機制。當前的Agent記憶較爲短暫且事務性強,完成任務後記憶往往丟失,這極大限制了複雜任務的持續委託和管理。Kevin強調,Agent必須能夠主動代表用戶操作,結合多種工具和信息源,這需要一個開放且類似互聯網的生態系統。每個已有的信息服務、網站或API都應被整合,使Agent能與之交互,並且激勵機制應傾向於推動這種整合。

今年的重要進展之一是出現了類似MCP這樣簡明開放的協議,以及微軟剛剛開源的NLweb,它們在Agent網絡中的作用類似於HTML在互聯網中的地位。Kevin預見這些開放、可組合且分層的技術將在社區中廣泛涌現,並推動Agent的普及和實用化。

主持人問到,既然Agent需要訪問互聯網和計算機上的信息,就必須依賴一定的協議和流程來實現,這對微軟來說有什麼重要意義?微軟希望在這個生態系統中扮演怎樣的角色?

Kevin Scott表示,有兩三個關鍵點非常重要。首先,微軟自身也在開發Agent,爲了讓這些Agent真正爲用戶服務,必須解決Agent內部的通信和協作問題。即使僅限於企業內部的Agent,微軟在內部推動所有系統間採用統一標準協議進行通信,避免讓構建Agent過程暴露微軟龐大的組織架構,從而提高效率,避免陷入康威定律帶來的負面影響。康威定律指出,系統設計往往反映團隊結構,如果協議不統一,開發過程會變得低效繁瑣。作爲工程師,面對沒有標準化協議和服務,每個人都各自爲政的情形,體驗非常糟糕。相比之下,要實現Agent的實際價值,就必須讓整個生態系統像互聯網早期一樣發展,形成統一、開放的標準。

他提到MCP協議就是一個很好的例子,作爲一個簡單的協議,解決了Agent、平臺構建者、用戶及服務提供方之間連接和交互的問題。越來越多的人不只是考慮如何連接單一系統,而是希望把自己的服務接入Agent網絡,並且從商業角度評估這種連接的可行性。對微軟而言,除了自己開發Agent,更重要的是發揮其作爲平臺公司的角色,憑藉過去50多年積累的豐富經驗,幫助推動和解決Agent生態系統發展中遇到的種種問題。

主持人提及微軟強力推動MCP,並計劃將其整合進Windows等系統,但有人認爲MCP的安全模型還不完善。Kevin被問及,互聯網有明確的安全模型如同源策略限制代碼執行權限,而MCP目前沒有類似機制,他怎麼看待這個安全問題?

Kevin迴應,他不敢斷言當前或未來的安全模型具體是怎樣,但MCP設計簡潔,社區可以較容易地探索和開發適合的安全機制。微軟特別關注企業級安全需求,並正與MCP團隊緊密合作推進相關工作。核心是賦予Agent身份識別功能,構建授權系統,確保Agent在執行任務時能夠明確定義自己代表的人和權限範圍。例如,當Agent需要訪問某些資源或系統時,它可以查詢所需權限,並向使用者請求授權,用戶可明確允許或拒絕。同時系統管理員也能控制是否允許Agent操作。這樣一來,安全性和可控性得以保障。

Kevin強調,這些安全能力在MCP之上雖然並非完全簡單,但相對容易實現。關鍵是要用開放的方式推動這項工作,讓生態系統像互聯網一樣開放協作,而不是成爲某個廠商或者系統的專有技術。最終目標是讓整個Agent網絡高效、安全地運轉,惠及更多用戶和開發者。

主持人提到,目前存在兩種潛在的市場或商業模式:一種是高度垂直整合的模式,開發者掌控模型和用戶界面,直接打造完整的應用,就像蘋果的iPhone和App Store一樣,以此保證安全性;另一種是開放模式,雖然安全性難以完全保障,但因爲沒有中心化的管理,創新活力會更強。他想知道微軟如何在這兩種模式之間權衡。

Kevin Scott認爲,這樣的二分法未必準確。開放系統的一個重要特點是無需許可——任何人都可以自由創新和構建,無需中心機構的授權和干預,這大大降低了創新壁壘,減少了不必要的中間環節。他觀察到,過去幾年中出現的一些中間角色,實際上並未爲創作者和消費者帶來實質價值。開放性讓創意自由流動,這點令他非常振奮。同時,他也認爲,藉助先進的AI技術,開放系統完全可以實現強有力的安全保護。比如,可以爲用戶配備專屬的智能代理,這些代理了解用戶的隱私偏好和安全需求,能對潛在風險進行判斷和響應。他舉了一個例子:當他收到關於妻子賬戶可能遭遇雙因素認證異常的電子郵件時,他第一時間選擇發短信確認,而不是郵件,因爲短信更安全。設想如果有智能代理能監控並判斷這些通信的異常情況,就能提前發現和應對安全威脅。因此,他認爲安全和開放是可以兼得的,並不存在必須取其一的侷限。

隨後主持人提問,軟件工程領域正經歷劇烈變化,而Kevin本人對工匠精神有着深厚的理解和熱愛,他既是程序員,也喜歡自己做陶藝、木工等手工活。有觀點認爲,使用智能代理輔助編程可能會讓人失去自己動手寫代碼的“感覺”,對此Kevin怎麼看?

Kevin表示,他對製造者羣體懷有敬意,這個羣體包括軟件工程師、機械師、木工、陶藝家等,他們都通過自己的熱情和專業把無形的創意轉化爲具體的成果。熱愛自己工作的人會對所用的工具、材料和方法有強烈的偏好和獨特見解。這是做好工作的基礎。他自己從12歲開始編程,至今已有四十餘年,對軟件開發的演變歷歷在目。軟件開發性質的變化多次發生,技術進步使得人們對如何完成工作的看法產生分歧,這很正常。他也坦言,個人有選擇權——比如他雖然屬於“老派”,喜歡用Vim這類傳統文本編輯器,避免使用Visual Studio Code,但這完全是他的個人習慣和工作方式。當然他同時會靈活採用最有效的手段達成目標,不在乎他人的評價。

他進一步舉了木工領域的例子:曾有人爭論,使用電動工具還算不算是真正的木工工匠?後來爭論轉向CNC數控工具的使用,這表明工具變革總是伴隨對“傳統”定義的討論。Kevin理解這些觀點,也認爲這只是不同價值取向所致——有人看重過程,有人看重結果,而選擇自然不同。

他強調,問“你是不是真正的匠人”實際上是價值觀的碰撞,是個人選擇,沒有絕對標準。他鼓勵大家保持對自己工藝的熱愛,同時也要開放心態面對新工具和新技術。他以自己的經歷爲例,說自己對3D打印機等新興工具起初不夠感興趣,後來才興起學習熱情,並發現它們極大地提升了自己的工作效率。他建議大家持續保持好奇,嘗試新東西,如果有效就使用,不合適就放棄。

總結來說,Kevin認爲工匠精神和現代技術不會衝突,兩者可以兼得,只是採用工具的偏好和風格因人而異。擁抱變化,尊重自我,是未來技術發展中每個人都應持有的態度。

主持人詢問Kevin Scott,他如何看待軟件工程領域中Agent的未來發展,是會由單一統治性的Agent主導,還是會出現多樣化的Agent生態。他回答說,未來將會有多種不同類型的Agent共存,這是一件好事。微軟將通過GitHub Copilot和正在開發的GitHub Agent等產品,努力提供實用且受歡迎的工具,但他認爲不太可能出現全球所有開發者都只使用同一款工具的局面。開發者享受選用多樣工具的自由,且在他的四十年編程經歷中,人們總是在不斷更換和嘗試新的開發工具。

對於不同Agent之間的差異,Kevin認爲關鍵在於各自解決問題的方式和對問題的理解深度。如今,一些創新的初創公司並不是從基礎設施入手創造差異,而是通過針對具體問題更深刻的認知,在現有基礎設施上進行調整和改進,從而提供獨特且高效的解決方案。正因爲越來越容易針對特定需求定製解決方案,市場上會涌現出更多、多樣化的Agent,努力滿足不同用戶的細微需求。那怕是軟件開發工具領域,在過去一年也涌現了大量新穎且頗具吸引力的產品,儘管變化迅速給產品開發增加難度,但同時也增強了創新的趣味性。

主持人繼續提問,假設一年後再舉辦Build大會,目前關注的一些熱門話題和重大問題,哪些會失去熱度,而未來又將聚焦哪些趨勢。Kevin表示,仍然堅持認爲技術尚未成熟、成本高或能力不足而遲遲不開始採用的人,將會在未來落後。隨着技術逐年加速發展,成本降低,當前這些理由變得難以成立。市場不再關注那些唱衰技術發展的人,因爲押注技術停滯是一個高風險的選擇。相反,大家會把更大的期望放在Agent能解決的問題上,雄心也會進一步提升。

未來,Agent的交互模式將發生深刻變化。當前大多數人使用Agent時,是以同步方式進行:用戶發送請求,等待Agent反饋,然後基於結果行動。未來,隨着Agent網絡的完善和推理能力的提高,人們會更多采用異步交互。Agent將獨立處理耗時長的複雜任務,調用多個系統接口,整合多個反饋,並經過多輪迭代優化。最終在適當時候,Agent會將結果交回給用戶,由用戶接手後續行動。這種“先由Agent長時間自主推進任務,後由用戶介入”的模式,是Kevin眼中值得期待的未來發展。