Google Gemini Mac 版即將支援 Computer Use,直接挑戰 Claude Cowork
Google 正秘密開發 Gemini Mac App 的代理操控功能,讓 AI 得以直接控制滑鼠、鍵盤與本機檔案,與 Anthropic Claude Cowork 展開正面競爭。根據 9to5Google 的 APK 拆解報告,四大功能方向已浮出水面。
Google Gemini Mac 版即將支援 Computer Use,直接挑戰 Claude Cowork
Google 正秘密開發 Gemini Mac App 的代理操控功能,讓 AI 得以直接控制滑鼠、鍵盤與本機檔案,與 Anthropic Claude Cowork 展開正面競爭。
根據科技媒體 9to5Google 於 2026 年 5 月 5 日發布的 APK 拆解報告,Google 正在為 macOS 版 Gemini 應用程式準備全新的 代理(Agentic)電腦操控功能,代號相當於業界熟知的「Computer Use」。這項功能一旦正式上線,將讓 Gemini 能夠主動執行任務、整理電腦檔案,甚至直接操作 Google Workspace 應用程式,如 Docs、Sheets 與 Gmail。
APK 拆解揭露四大功能方向
9to5Google 的 APK Insight 團隊在程式碼中發現了四組 Gemini 代理提示範本,清楚描繪出 Google 的開發藍圖:
1. Convert my files to a sheet
掃描本機資料夾(如發票、報告),自動提取資料並整理成 Google 試算表。
2. Organize my folders
找出桌面或下載資料夾中的雜亂檔案,依類型或內容自動分類並封存。
3. Standardize my files
讀取檔案中繼資料,批次重新命名數百個凌亂檔案。
4. Close the loop on my last meeting
從最近一次 Google Meet 的逐字稿或筆記文件中,自動起草後續追蹤信件。
這四大功能的底層技術,將依賴 macOS 的 Screen Access(螢幕存取) 與 Accessibility(輔助使用) 權限,讓 Gemini 得以看見螢幕畫面、控制滑鼠與鍵盤。
與 Claude Cowork 的直接對決
目前市場上,Anthropic 的 Claude Cowork 是桌面 AI 代理領域的領頭羊,能夠開啟檔案、控制瀏覽器、執行鍵鼠操作,甚至在使用者不在電腦旁時獨立完成任務,功能開放給 Claude Pro 和 Max 訂閱用戶使用。Google Gemini 若成功推出類似功能,將直接衝擊 Anthropic 的市場優勢。

值得注意的是,Google 早在 2025 年 10 月便已向開發者開放 Gemini 2.5 Computer Use 模型,具備瀏覽器與行動裝置 UI 操控能力,但當時尚未針對桌面作業系統層級進行優化。此次 Mac App 的代理功能,代表 Google 正跨越這道門檻,正式進入 OS 層級的 AI 競賽。
Gemini Mac App 現況
Google 於 2026 年 4 月 15 日 正式發布 Gemini macOS 原生應用程式,提供原生聊天介面與 Option + Space 快速呼叫快捷鍵,使用者可隨時分享目前視窗給 Gemini 取得即時情境協助。現階段應用程式免費提供給所有使用者,支援 macOS Sequoia 15.0 以上版本,且僅限 Apple Silicon 機型。
搶先 Google I/O 2026 布局
Google 尚未正式確認上述代理功能的推出時程。然而此一爆料時間點頗具意義——Google I/O 2026 預計於 5 月 19 至 20 日登場,主題正是「定義代理 AI 時代」(Defining the Agentic AI Era),預計將有更多 Gemini 重大更新揭曉。
分析人士指出,若 Google 能在 I/O 上正式宣布 Mac 版代理功能,將是對 Anthropic 和 OpenAI 最有力的回擊。此舉不僅能搶佔桌面 AI 代理市場,更能強化 Google 在「代理 AI 時代」的領導地位,直接威脅 Claude Cowork 與 OpenAI 的市場份額。
市場影響與展望
若 Gemini Mac 版代理功能順利推出,預期將帶來以下市場變化:
- 生產力工具重新洗牌:AI 代理將從輔助工具升級為主動執行者,改變使用者與電腦的互動模式
- 訂閱模式競爭加劇:Google 可能推出付費 Gemini Pro 版本以支援高級代理功能,與 Claude Pro 展開直接競爭
- 隱私與安全考量:OS 層級的 AI 操控涉及敏感權限,將引發用戶隱私與資訊安全的討論
- 開發者生態擴展:第三方應用將能透過 Gemini API 接入代理功能,形成新的應用生態