Google Gemini Mac 版即將支援 Computer Use,直接挑戰 Claude Cowork

Google 正秘密開發 Gemini Mac App 的代理操控功能,讓 AI 得以直接控制滑鼠、鍵盤與本機檔案,與 Anthropic Claude Cowork 展開正面競爭。根據 9to5Google 的 APK 拆解報告,四大功能方向已浮出水面。

Share
Google Gemini Mac 版即將支援 Computer Use,直接挑戰 Claude Cowork

Google Gemini Mac 版即將支援 Computer Use,直接挑戰 Claude Cowork

Google 正秘密開發 Gemini Mac App 的代理操控功能,讓 AI 得以直接控制滑鼠、鍵盤與本機檔案,與 Anthropic Claude Cowork 展開正面競爭。

根據科技媒體 9to5Google 於 2026 年 5 月 5 日發布的 APK 拆解報告,Google 正在為 macOS 版 Gemini 應用程式準備全新的 代理(Agentic)電腦操控功能,代號相當於業界熟知的「Computer Use」。這項功能一旦正式上線,將讓 Gemini 能夠主動執行任務、整理電腦檔案,甚至直接操作 Google Workspace 應用程式,如 Docs、Sheets 與 Gmail。

APK 拆解揭露四大功能方向

9to5Google 的 APK Insight 團隊在程式碼中發現了四組 Gemini 代理提示範本,清楚描繪出 Google 的開發藍圖:

1. Convert my files to a sheet

掃描本機資料夾(如發票、報告),自動提取資料並整理成 Google 試算表。

2. Organize my folders

找出桌面或下載資料夾中的雜亂檔案,依類型或內容自動分類並封存。

3. Standardize my files

讀取檔案中繼資料,批次重新命名數百個凌亂檔案。

4. Close the loop on my last meeting

從最近一次 Google Meet 的逐字稿或筆記文件中,自動起草後續追蹤信件。

這四大功能的底層技術,將依賴 macOS 的 Screen Access(螢幕存取)Accessibility(輔助使用) 權限,讓 Gemini 得以看見螢幕畫面、控制滑鼠與鍵盤。

與 Claude Cowork 的直接對決

目前市場上,Anthropic 的 Claude Cowork 是桌面 AI 代理領域的領頭羊,能夠開啟檔案、控制瀏覽器、執行鍵鼠操作,甚至在使用者不在電腦旁時獨立完成任務,功能開放給 Claude Pro 和 Max 訂閱用戶使用。Google Gemini 若成功推出類似功能,將直接衝擊 Anthropic 的市場優勢。

Claude Cowork 代理功能

值得注意的是,Google 早在 2025 年 10 月便已向開發者開放 Gemini 2.5 Computer Use 模型,具備瀏覽器與行動裝置 UI 操控能力,但當時尚未針對桌面作業系統層級進行優化。此次 Mac App 的代理功能,代表 Google 正跨越這道門檻,正式進入 OS 層級的 AI 競賽。

Gemini Mac App 現況

Google 於 2026 年 4 月 15 日 正式發布 Gemini macOS 原生應用程式,提供原生聊天介面與 Option + Space 快速呼叫快捷鍵,使用者可隨時分享目前視窗給 Gemini 取得即時情境協助。現階段應用程式免費提供給所有使用者,支援 macOS Sequoia 15.0 以上版本,且僅限 Apple Silicon 機型。

搶先 Google I/O 2026 布局

Google 尚未正式確認上述代理功能的推出時程。然而此一爆料時間點頗具意義——Google I/O 2026 預計於 5 月 19 至 20 日登場,主題正是「定義代理 AI 時代」(Defining the Agentic AI Era),預計將有更多 Gemini 重大更新揭曉。

分析人士指出,若 Google 能在 I/O 上正式宣布 Mac 版代理功能,將是對 Anthropic 和 OpenAI 最有力的回擊。此舉不僅能搶佔桌面 AI 代理市場,更能強化 Google 在「代理 AI 時代」的領導地位,直接威脅 Claude Cowork 與 OpenAI 的市場份額。

市場影響與展望

若 Gemini Mac 版代理功能順利推出,預期將帶來以下市場變化:

  • 生產力工具重新洗牌:AI 代理將從輔助工具升級為主動執行者,改變使用者與電腦的互動模式
  • 訂閱模式競爭加劇:Google 可能推出付費 Gemini Pro 版本以支援高級代理功能,與 Claude Pro 展開直接競爭
  • 隱私與安全考量:OS 層級的 AI 操控涉及敏感權限,將引發用戶隱私與資訊安全的討論
  • 開發者生態擴展:第三方應用將能透過 Gemini API 接入代理功能,形成新的應用生態

Read more

【設計師的 AI 秘笈】全網最簡教學!用 Codex + Figma MCP 自動搭建設計系統與整理圖層

【設計師的 AI 秘笈】全網最簡教學!用 Codex + Figma MCP 自動搭建設計系統與整理圖層

每次整理 Figma 圖層、提取 Variables 或搭建設計系統,總覺得在做苦工嗎?這篇文章將手把手教你如何透過MCP ,把 AI 變成你的專屬設計助理!只要幾個簡單的步驟,AI 就能直接讀取你的 Figma 檔案幫你打理一切。文末更加碼分享如何用最省額度的方式與 AI 溝通,跟著教學一起解放你的設計生產力吧!