☰

京滬網信辦通報整治AI技術濫用成效｜南財合規週報（第194期）

每週，“合規週報”會盤點最近一週國外人工智能、科技競爭、個人信息保護上值得關注的動態。

本週，我們重點關注直播電商新規徵求意見；京滬網信辦通報整治AI技術濫用成效。

海外方面，微軟發佈AI Agent故障白皮書；美法院向OpenAI簽發數據保存命令；維基百科測試AI摘要功能，遭衆編輯反對而暫停。

平臺治理

直播電商新規徵求意見

6月10日，市場監管總局發佈《直播電商監督管理辦法（徵求意見稿）》（以下簡稱《辦法》），直播電商生態中既有阿里、京東、拼多多傳統電商平臺，也有微信、小紅書等社交平臺，以及抖音、快手等短視頻平臺，電商屬性與社交、內容屬性交叉，平臺認定存在難點；此外，主播、MCN機構、商家等參與主體更加複雜，交易鏈條更長，外溢風險增加。

《辦法》《辦法》明確了劃入規範的平臺屬性：直播電商平臺經營者是指在直播電商活動中提供網絡經營場所、交易撮合、信息發佈、商品瀏覽、訂單生成、在線支付等服務，供交易雙方或者多方獨立開展交易的法人或者非法人組織。細化了平臺經營者的法定責任，包括資質覈驗與信息報送義務；建立直播營銷人員真實身份動態覈驗機制；建立黑名單制度，並共享“黑名單”主體信息。對於主播、機構等直播間運營者，也要進行信息發佈審覈、信息公示，商品價格規則要透明。

京滬網信辦通報整治AI技術濫用成效

4月30日，中央網信辦開展“清朗·整治AI技術濫用”專項行動。近日，北京網信辦與上海網信辦公佈了最新進展：京東新增100個AI特徵敏感詞，攔截違規內容；崑崙萬維、零一萬物等企業完善訓練語料清洗機制，防範虛假信息、違規內容傳播等。微博清理傳播教授AI換臉教程類內容162條，關閉賬號22個，清理分享售賣違規AI產品類有害信息234條，關閉賬號52個；抖音清理AI生成的虛假信息、低俗內容等24749條等。百度對存量數據進行整體清洗，使用211個權威網站的正能量數據源；百川停止使用存在疑問的數據來源，制定嚴格的網絡爬取規範，確保數據合規合法。強化敏感內容過濾，360、深言科技等企業優化語義識別模型，提高涉政、涉黃內容攔截準確率等。智譜明確禁止生成具體股票推薦、基金購買建議，避免誘導高風險投資；快手對醫療回答明確標註“不替代專業醫療建議”。猿力科技對未成年人提問進行分級審覈，僅允許教育類內容生成；小米通過實名認證和年齡校驗，限制未成年人使用AI生成暴力內容等敏感功能。目前已有近60家企業已落實標識要求，微博、抖音等平臺實現生成內容“顯著標識+元數據水印”雙標註。攻防技術升級，百度、字節跳動等企業建立“紅藍對抗”機制，模擬攻擊案例，修復潛在安全漏洞，優化模型對虛假信息的識別能力等。

上海市委網信辦指導小紅書、嗶哩嗶哩、拼多多等15家重點網站平臺，集中清理“一鍵脫衣”、未經授權的人臉或人聲克隆編輯、未備案等違規AI產品、商品及相關營銷、炒作、推廣、教程信息。

美團針對騎手、商家和用戶三方痛點提出改進建議

近日，美團在北京舉辦算法顧問委員會首場研討會，旨在推動算法透明化建設，聚焦騎手權益保障與行業可持續發展。2024年以來，美團已推出八項算法改進舉措。推動算法“反內卷”，需要權衡多方利益、考慮多種變量。比如履約服務過程中的不確定性，騎手收入，配送安全，合理的勞動強度等，這也是美團持續開展各方懇談交流會，尋求穩步改進的原因。研討會上，針對騎手、商家和用戶三方痛點，委員會成員們提出建議，並提出給女性騎手“多一份安全保障”。

海外動態

微軟發佈AI Agent故障白皮書，萬字解讀各種惡意智能體

6月7日，微軟發佈了《AI Agent系統故障模式分類》白皮書，以幫助開發者和用戶更好的理解、解決日常Agent出現的各種故障。這些故障主要分爲新型故障和既有故障兩大類，並詳細解讀了出現這些故障的原因以及如何解決。包括有新型Agent安全故障，比如：智能體僞裝、智能體配置中毒、智能體妥協、智能體注入、智能體流程操縱、多智能體越界等。還有既有Agent安全故障，比如：智能體內在安全問題、多用戶場景中的分配危害、優先級導致用戶安全問題、透明度和問責制不足、組織知識損失、目標知識庫中毒、跨域提示注入、人機交互循環繞過等。最後提出了安全Agent設計建議，包括：身份管理、內存強化、控制流控制、環境隔離、日誌記錄與監控等。

美法院向OpenAI簽發數據保存命令，OpenAI稱該命令將侵犯全球數億人的隱私

6月9日，據媒體報道，OpenAI向紐約聯邦法院提交文件《依據〈聯邦民事訴訟規則〉第72(a)條就跨區訴訟ECF 33號保存令提出異議的法律備忘錄》，要求撤銷治安法官Ona T. Wang此前簽發的數據保存命令（保存並隔離所有輸出日誌數據）。該公司稱該“範圍廣泛、前所未有”的命令威脅數億用戶隱私權，強制剝奪用戶對ChatGPT對話數據的控制權。OpenAI請求地區法官Sidney H. Stein否決Wang法官的裁決。

維基百科測試AI摘要功能，遭衆編輯反對而暫停

當地時間6月11日消息，維基百科的運營機構維基媒體基金會（Wikimedia Foundation）宣佈暫停一項使用人工智能技術生成文章摘要的測試。原因是大量編輯對此舉表示強烈反對，他們普遍認爲使用AI生成內容將導致維基百科信息質量下降，進而破壞網站信譽。測試版本中，AI生成的摘要將顯示在文章頂部，用戶必須單擊才能展開並閱讀，摘要上方有黃色標籤“未經驗證”，提示用戶內容系AI自動生成。衆多編輯指出，機器生成的內容不應該優先於人工審查的材料，AI技術的引入會破壞該網站的協同創作模式。雖然人類編輯可能會犯錯，但通過平臺的協同創作模式通常能實現平衡；在沒有適當社區監督的情況下，人工智能摘要引入不準確或偏見的可能性更大。

首個AI Agent零點擊漏洞曝光：一封郵件竊取企業AI任意敏感數據

6月12日消息，微軟365 Copilot是集成在Word、Excel、Outlook、PowerPoint和Teams等Office辦公應用中的AI工具。研究人員日前發現，該工具存在一個嚴重安全漏洞，揭示了AI代理被入侵可能帶來的更廣泛風險。AI安全初創公司Aim Security發現並披露了這一漏洞，據稱這是已知首個針對AI代理的“零點擊”攻擊案例。只需發送一封看似無害但暗藏定製化指令的電子郵件，當Copilot後臺掃描郵件時會執行該指令，遵從要求訪問AI訪問權限內的敏感數據，並悄悄對外滲出。該漏洞暴露了AI Agents的根本缺陷，指令和數據未做分離。研究人員建議可以重新設計系統增強模型區分指令和數據的能力，或者在應用層引入強制安全機制。

動畫行業發佈AI緊急宣言，劃出知情、補償、控制三條底線

6月9日，據媒體報道，在有“動畫界奧斯卡”之稱的安納西國際動畫電影節召開之際，多家工會機構聯合發表了一份緊急聲明《動畫行業陷入危機：面對AI的使用，各國工會宣佈進入緊急狀態》，面向監管者和行業管理層提出“知情、補償、控制”，三項明確的主張。簽署的25家組織主要爲歐美大型行業工會，包括西班牙視頻遊戲工會、法國動畫和視覺特效工會，美國、比利時、荷蘭、愛爾蘭等國動畫工會。與此同時，法律體系尚未就“AI訓練是否構成侵權”這一關鍵問題給出清晰判定。就在上週，全球最大的圖片版權商Getty Images 在英國高等法院起訴 Stability AI，指控其未經許可，使用數百萬張照片來訓練其文生圖大模型。

京滬網信辦通報整治AI技術濫用成效｜南財合規週報（第194期）

相關資訊