☰

AI 上新｜我讓 AI「偷窺」了我的屏幕，它有機會變成我第二個大腦

行業深度文章的撰寫，在堆積如山的數據分析文件和瀏覽器標籤頁中掙扎了整整兩天。

那種感覺，就像在自己的知識庫裡溺水——你明確地記得看過某個數據、某段論述，卻無論如何也無法在信息的洪流中重新定位它。

我們早已習慣了這種數字時代的「失憶症」，也習慣了將希望寄託於 AI。我們像一個耐心的飼養員，不斷地在應用之間複製、粘貼、切換，把上下文一點點「喂」給 ChatGPT，只爲換取一次靈光乍現。

此時，一個名爲「Glass」的項目引起了我的注意。這款據開發團隊介紹致力於成爲用戶「數字大腦拓展」的應用，並非又一個 AI 聊天框的變體，而是一個完全迥異的存在。

它將「被動觀察」這一理念，原汁原味地注入了我的 macOS，並由此讓我得以一窺，當 AI 成爲你心智的延伸時，人機交互的終極形態，究竟有多遠。

面向未來的AI助手，但是開發者版

Glass 沒有任何傳統意義上的「界面」。它的「安裝」，更像是一套開發者環境的配置流程，需要你熟悉 Python 和 Node.js。它的「實體」，則只是一個靜默地躺在菜單欄的圖標。

進入 Glass，首先是幾個直接的權限請求：

屏幕錄製權限

麥克風訪問權限

輔助功能權限

Glass 需要的用戶隱私權限都非常敏感｜圖片來源：極客公園

沒有任何花哨的引導，每一個權限都直指其核心：一個需要完整觀察你、傾聽你的 AI。

如果僅看 Glass 安裝完成之後的效果，可能很難意識到這是一個 AI 應用——你甚至是可以選擇是否將其隱藏：這裡並非物理意義上的隱藏，而是在數字世界中隱藏，即使你將屏幕分享給其他用戶，他們也無法看到 Glass 的存在。

Glass 以一個懸浮藥丸的形式運行於系統中｜圖片來源：極客公園

這正是 Glass 的核心理念：AI不應是一個需要被頻繁喚起注意到的「工具」，而應是一個與你伴生的「記憶體」。

傳統 AI 助手的工作模式是「你問，我答」，這個過程是割裂的、非連續的。而 Glass 顛覆了這一點，它的工作模式是「我觀察，你隨時問」。它在後臺默默地記錄你的一切數字化行爲，並將其內化爲自己的記憶。

它不再需要你費力地去「解釋上下文」，因爲它本身，就活在你的上下文裡。

當記憶不再是負擔

看完了它極簡的「頁面佈局」，我很好奇 Glass 的實戰表現如何。

先說結論，Glass 主要有我們已經熟悉的部分，也有不同於現有任何 AI 工具使用體驗的部分。

首先，它並不是一個現有 AI 大模型工具的便捷訪問入口，Glass 雖然可以直接提問，但問題的內容總是與屏幕中顯示的內容相關。你可以直接通過快捷鍵，來向它提問各種關於當前屏幕的內容。

但這只是 Glass 真正能力的冰山一角：當你點擊懸浮欄中的 Listen 按鈕，Glass 就會切換爲監聽模式，從靜態讀取你當前桌面上的內容，變爲持續記錄你電腦屏幕過去出現過的各種畫面信息與音頻，並基於此生成一份總結報告。

在會議紀要場景中，Glass 不僅能實時生成一份會議紀要重點，並且還能實時轉錄音頻，當然目前的體驗中還只支持英文，對於中文語音的支持欠佳。

但 Glass 比起其他會議紀要類 AI 工具最大的不同，是它不受某個 App 的限制，可以全局記錄並提取過去屏幕中的內容，並且根據記錄下來的內容實時生成摘要以及問題總結。

除了老生常談的會議記錄功能，Glass 的應用場景還能體現在看視頻上：我在 Glass 開啓的狀態下，打開一個主題是關於 F1 車手劉易斯-漢密爾頓的採訪視頻。在不到三分鐘之後，Glass 就通過目前讀取到的內容，幫我生成了一份當前內容摘要。

在這份摘要中，Glass 還會主動提供數個進一步問題，供你進一步瞭解視頻內容，當然在這個階段，你同樣可以自己提問你仍然感覺疑惑的問題。

這份摘要內容本身會隨着屏幕內容數據的不斷增加，進一步更新更多相關內容，目前 Glass 分析本身支持中文內容，但自動生成的內容彙總目前還只能以英文的方式展示——這種情況我們在如今的 Apple Intelligence 中 ChatGPT 的體驗中也曾見過，都是模型本身支持中文內容、應用層沒有做適配產生的問題。

Glass 的屏幕內容摘要功能支持中文，但支持的不多｜圖片來源：極客公園

在直接針對屏幕內容的提問中，由於我可以直接使用中文提問，因此回答也會採用中文回覆，這很大程度上提高了這一功能對中文用戶的友好程度。

Glass 可以針對記錄的屏幕內容提問｜圖片來源：極客公園

全局讀取屏幕信息並記錄，是一個潛力幾乎無上限的功能，我遇到的第一個震撼瞬間，是在 VSCode 裡重構一個複雜的項目。

當我使用 Gemini 修改完一串代碼，然後腦中突然閃過一絲不確定。此時，我沒有急於修改撰寫的那段代碼，而是直接通過快捷鍵喚出 Glass，問道：「幫我分析一下修改的那部分代碼的核心邏輯。」

幾秒種後，一個對話框以通知的方式彈出，用清晰的列表總結了函數的用途和我的修改點。

我沒有複製任何代碼，沒有跳轉任何頁面。我只是提出了一個基於「屏幕內容」和「需求」的問題，Glass 就從屏幕中爲我提取了答案。

另一個，則是 Glass 對非結構化信息（如會議語音）的驚人處理能力。在一場持續一個多小時的線上腦暴會中，我全程投入討論。會議結束後，Glass 已經自動生成了一份詳盡的會議紀要，不僅區分了不同發言人，甚至提煉出了關鍵的結論和待辦事項列表。

它就像一個永不疲倦的書記員，將稍縱即逝的多模態內容流，沉澱爲結構化的信息資產。

可以說，Glass 的首秀，就將目前AI助手最大的痛點——上下文的缺失和跨應用操作的割裂感解決了。同時作爲一個開源項目，Glass 即使是全時監控屏幕下，也沒有對電腦的內存產生特別巨大的壓力——這一點足以讓我願意讓它全天運行在我的電腦上，在我需要它的時候將它喚醒。

話雖如此，但我仍然不建議電腦內存在 16GB 以下的 Mac 設備（當前 Glass 只有 macOS 版本，Windows 版本在開發中）長時間運行 Glass，仍然給電腦造成明顯的卡頓現象。

但簡單的產品應用邏輯，也說明 Glass 放棄了所有取巧的路徑，它依賴雲端服務器對你的行爲進行分析（至少在開源版本中），同時選擇在本地進行大量的結構化信息整理任務。這意味着所有的屏幕錄製、語音識別，幾乎都直接壓在了處理器本身上，自然也就帶來了更高的硬件負載。

記憶延伸的源流與未來

Glass 的推出，雖然只是一個名爲 Pickle 的小團隊的開源項目，但其背後的理念，卻可以追溯到上個世紀。

1945 年，在美國科學家範尼瓦·布什（Vannevar Bush）發表於《大西洋月刊》的著名文章《誠如所思》（As We May Think）中，一個名爲「記憶擴展器」（Memex）的革命性概念被首次提出。這個構想遠早於個人電腦和互聯網的誕生，卻以驚人的前瞻性預示了未來信息技術的發展方向，並對後來的超文本（Hypertext）和個人計算領域產生了深遠的影響。

《誠如所思》（As We May Think）｜圖片來源：Wikipidia

「記憶拓展器」的核心邏輯，是通過技術手段，將個人的知識和記憶外部化，使其成爲一個可供隨時訪問的「外接大腦」。

是不是很熟悉？Glass 所做的事情，正是 Memex 理念在 AI 時代的具象實現。它不再侷限於存儲文檔和書籍，而是將用戶動態的、實時的「行爲」本身作爲記錄對象，通過大型語言模型的「關聯索引」，最終實現一個遠超任何傳統知識庫的、活的、個人的記憶系統。

Glass 這個項目更深遠的目標——「爲每個人建立一個活的數字克隆」，則更是這一理念的極致延伸。它不僅要成爲你的記憶，更渴望成爲你的「代理」，一個可以理解你、模仿你、甚至代替你執行任務的數字孿生。

但回到現實，目前 Glass 的體驗顯然距離這個目標距離還很遙遠：Glass 需要你手動輸入 OpenAI 或 Gemini 的 API Keys，現階段 Glass 也提供了登錄賬號、免費試用開發團隊提供的 API Key 額度的解決方案。同時正常使用也需要前置安裝 Python 與 Node 環境庫，雖然門檻實際上並不高，但也並沒有達到「開箱即用」的地步。

即便如此，Glass 在開源之後還是迅速在 GitHub 上吸引了不少關注，短短四天已經破超過 3K Star，迅速在 AI 工具圈走紅。

在 Glass 背後，開發團隊 Pickle是一家致力於構建「數字思維擴展（Digital Mind Extension）」的公司。他們剛剛在上個月從 Y Combinator 吸引到了 60 億韓元（約 3100 萬人民幣）的投資。

Pickle 脫胎於另一個開源項目 Cheating Daddy，而 Cheating Daddy 又是另一個「臭名昭著」的項目 Cluely 的開源版本——後者在今年曾因爲閉源、付費以及最重要的面試作弊這一賣點頗受關注，同時也引來的諸多爭議。

由於 Pickle 項目中存在大量 Cheating Daddy 項目的內容直接複用，目前 Cheating Daddy 創始人就這一點在 X 上對 Pickle 發起討伐，指責「開源項目並不意味着可以拿來照抄」，但這件事尚未得到 Pickle 團隊的正面迴應。

但目前作爲一個輕量級的解決方案，Glass 仍然不失爲一種值得觀察的思路；此前主打「全天候記錄用戶信息」的 Rewind.ai 項目，就因爲對設備的內存佔用過高，同時對結構化內容整理效果不盡人意，因而迅速退出 AI 工具的主流舞臺。

Glass 這類產品所代表的「主動感知 AI」，這個曾在科幻作品中反覆出現，代表着高效與智能的詞彙，距離真正到我們的日常生活中落地，或許已經不遠。

一個輕量級工具的脫穎而出，更是說明了這個過程中，用戶核心需求的提煉——沒錯，一個完美的記憶體的確很強大，AI 的輔助也的確很努力，但人們想得到的，或許僅僅是一個能讓自己工作更順暢、思考更專注的普通的好工具。

本文源自：極客公園

AI 上新｜我讓 AI「偷窺」了我的屏幕，它有機會變成我第二個大腦

相關資訊