AI一日三新品:微軟自立門戶,OpenAI搶佔語音,馬斯克奇襲編程
8月29日消息,週四,微軟、OpenAI與埃隆·馬斯克旗下的xAI不約而同地發佈了各自最新的AI模型,此舉不僅標誌着AI賽道的競爭已進入白熱化階段,也凸顯了核心技術正以前所未有的速度向前推進。
微軟:自研模型,志在掌控AI命運
微軟週四推出了兩款自主研發的強大AI模型,此舉標誌着微軟的人工智能部門將不再“藏於幕後”,而是要正式走向臺前,與OpenAI等行業巨頭正面競爭,從而在高風險的AI賽道上掌握自己的命運。
MAI-Voice-1:一款高效的語音AI模型,能夠在單個GPU上運行,並在不到一秒內生成一分鐘的音頻。
· MAI-1-preview:一款文本模型,預計將爲未來版本的Copilot AI助手提供支持。
這兩款模型在設計上都高度注重成本效益。 微軟人工智能部門負責人穆斯塔法·蘇萊曼(Mustafa Suleyman)透露,微軟採用了部分來自開源社區的技術,以MAI-1-preview爲例,其訓練僅使用了約1.5萬顆英偉達H-100 GPU,遠低於xAI的Grok模型所使用的超10萬顆。
“如今,訓練模型的藝術就在於選擇完美的數據,避免在無效的Token上浪費任何計算力,”蘇萊曼強調。
儘管AI模型日趨高效,但消費者需求和新技術對算力的依賴持續增長,導致AI公司面臨着巨大的成本挑戰。蘇萊曼透露,微軟的AI團隊已在全球多個頂級數據中心着手開發下一代模型,這些數據中心均配備了英偉達的下一代芯片GB-200。他描繪了一個“龐大的五年發展路線圖”,並表示“每個季度都在進行投資”。
“作爲全球最大的公司之一,我們必須具備打造世界最強模型的內部專業能力,”蘇萊曼表示。不過,他也試圖淡化與長期合作伙伴OpenAI的潛在競爭,稱“我們的目標是深化合作關係”。
作爲一名AI安全的倡導者,蘇萊曼近期曾撰文警告“看似有意識的AI”的危險,並表示微軟的目標是在“後訓練”階段,像雕刻一樣移除讓模型看起來擁有情感和目標的特徵。“盲目模仿所有人類能力存在實際風險,而現在正是我們主動思考這些風險的時候。”
有分析認爲,儘管微軟仍處於構建強大AI模型的初期階段,但此舉對於微軟保持長期競爭力至關重要。其最終目標,或許是藉助Windows和Office的強大分發渠道,利用自研AI模型和基礎設施爲這些核心產品提供支持。
OpenAI:升級語音API,定義“下一個媒介”
同一天,OpenAI也發佈了其迄今爲止最先進的語音模型gpt-realtime,並宣佈其Realtime API在歷經數月公測後已廣泛可用。
“我們認爲語音是下一個媒介,”OpenAI產品負責人邁克達德·賈弗(Miqdad Jaffer)表示,“通過語音來表達,比文本更簡單、更自然。”
據介紹,OpenAI於2024年10月首次以公測版形式推出了Realtime API,此次更新後,將支持遠程模型上下文協議(MCP)服務器、圖像輸入和電話呼叫。OpenAI方面表示,MCP非常適合語音命令,能讓用戶無縫地通過已連接的應用程序執行操作。
這些擴展功能將使得語音智能體能夠訪問更多工具,並擁有更豐富的上下文來協助用戶。這不僅簡化了將AI模型與數據源連接的過程,並且MCP作爲一項開放標準,還能在確保連接安全性的同時,優先保護用戶的數據和隱私。
新的gpt-realtime模型則在多個維度上實現了顯著提升:不僅在智能化、函數調用和遵循複雜指令方面有所改進,還能在單個句子中途流暢地切換語言。其演示版本展現了逼真的類人特性,聲音的起伏能夠表達多種情感,甚至在面對“越獄嘗試”時也能冷靜地重新引導對話。此外,該模型還能分析照片內容,並就其觀察與用戶展開討論。
賈弗特別強調了“遵循指令”能力的重要性,他認爲“能夠給出一組指令並讓模型穩定地執行,是構建模型的關鍵”。
此外,OpenAI還新增了兩種專供API用戶的語音Cedar和Marin。從週四開始,新模型和API已向所有開發者開放。賈弗建議開發者,“去做對你的用戶最有益的事情,我們相信語音就是未來。”
xAI:切入編程賽道,主打經濟高效
與此同時,馬斯克旗下的xAI也加入了這場發佈熱潮,推出了一款名爲grok-code-fast-1的“快速且經濟”的智能編程模型,正式進軍AI編程這一關鍵領域。
xAI表示,該模型將在有限時間內免費提供,首批發布合作夥伴包括了GitHub Copilot和Windsurf。其“優勢在於以經濟、緊湊的形式提供強勁的性能”,旨在成爲處理常見編程任務的高性價比選擇。
智能編程領域的競爭正日趨激烈。 微軟的GitHub Copilot已在企業中廣泛應用,其CEO薩提亞·納德拉(Satya Nadella)在4月透露,公司內部已有20%至30%的代碼由AI編寫。而OpenAI旗下的編程助手Codex也已於6月向ChatGPT Plus用戶開放。xAI此刻入局,無疑將使這一賽道的競爭格局更趨複雜。
三雄競逐,創新與競爭並存
微軟、OpenAI和xAI在同一天的模型發佈,共同勾勒出當前AI行業競爭激烈、創新層出不窮的圖景。
微軟正着力於通過自主研發掌握核心技術,並強調模型的成本效益和長期戰略部署;OpenAI則持續深耕其技術優勢,力圖在作爲“下一個媒介”的語音交互上定義行業標準;而xAI則以其“快速且經濟”的智能編程模型,切入AI編程助手這一關鍵應用領域。
這三家公司儘管在具體策略和側重點上有所不同,但都殊途同歸地致力於推動AI技術的邊界,並將其融入更廣泛的產品和應用中。這場“三雄爭霸”不僅加速了技術迭代,也預示着人工智能將在未來深刻改變我們的工作和生活方式。(小小)