Claude

【科技新聞】Claude Opus 4.1 上線：GPT-5 還沒出手，Anthropic 靠寫程式反超 OpenAI？企業級 AI 模型完整分析一次看懂

Claude Opus 4.1 正式上線，編程表現大幅超車 GPT-4，搶攻企業市場、Cursor 與 Windsurf 也火速支援。GPT-5 還沒出手，OpenAI 就已被反超？完整性能、市佔與操作指南一次看懂。

Vicky Tsai

06 Aug 2025 — 8 min read

Claude Opus 4.1 於 2025 年 8 月 6 日正式發布，是 Anthropic 針對 Opus 4 的輕量升級版本。主要著眼於編程、推理與 agent 任務的性能提升，並維持原價定價結構（每百萬輸入 token $15，每百萬輸出 token $75）。此版本立即可用於 Claude Code、API，以及透過 Amazon Bedrock 和 Google Cloud Vertex AI 平台使用，也開放給 Claude Pro、Max、Team 和 Enterprise 訂閱用戶。

同時，開發工具平台 Cursor 和 Windsurf 已陸續發布支援 Opus 4.1 的版本，將模型能力直接嵌入開發者工作流程中，提升開發效率與可操作性。

Claude Opus 4.1 是什麼？核心性能亮點解析

1. SWE‑bench Verified：編程能力再拉升

Claude Opus 4.1 在 SWE‑bench Verified（針對實務軟體工程問題的 benchmark）中取得 74.5% 準確率，較 Opus 4 的 72.5% 提升約 2%，也領先 OpenAI o‑series 多於 5%。

2. 改良多檔案重構與 agent 任務能力

GitHub 回饋指出，Opus 4.1 在「多檔案程式碼重構」任務中更穩定精準，而日本 Rakuten Group 亦表示它能在大型 codebase 中精准定位錯誤、不做多餘修改、不引入新 bug。

3. 推理與數學競賽進步

根據分析，Opus 4.1 在更多模擬推理與數學 benchmark（如 GPQA Diamond、AIME 等）也顯示性能進步，展現其在多步驟邏輯與數據分析任務上的提升能力。

4. 長上下文與 agentic search 能力加強

延續 Opus 4 的特長，Opus 4.1 支援長達 64K tokens（或據報更高至 200K tokens）的上下文窗口，適合執行持續數小時的研究或 code generation 任務。

市場地位逆轉：Anthropic 如何反超 OpenAI？

1. 企業用戶市佔率首超 OpenAI

根據 Menlo Ventures 最新報告，Anthropic 在企業大型語言模型使用量占比達 32%，已超越 OpenAI 的 25%，堪稱兩年前 OpenAI 曾擁有 50% 對比 Anthropic 12% 的顯著逆轉。專注 coding 應用的市佔率更高達 42%，是 OpenAI 的兩倍（OpenAI 為 21%）。

2. 業務營收高速成長

截至2025年5月，Anthropic 年化營收達 30 億美元以上，預期全年收入將落在 20–40 億範圍內，靠的是企業導向、高價值應用而非一般消費端訂閱。

3. GPT‑5 前的策略節奏

Anthropic 選擇在 GPT‑5 預期八月上線前發布 Opus 4.1，以增強在 coding 與 agent 領域的領先優勢，是明顯的策略性 timing——一邊鞏固市場地位，一邊迎戰 GPT‑5 潛在挑戰者。

Cursor 與 Windsurf 支援導入現況

1. Cursor 整合 Opus 4.1 模型

Cursor（專為 Claude 量身定制的 IDE 工具）已在設定介面「Models」標籤中加入 Opus 4 模型選項，開啟「Max Mode」後可支援高達 200K tokens 上下文能力，方便進行多檔案 refactor 與長 prompt 工作流程。

Claude Opus 4.1 is available in Cursor! Let us know what you think.
— Cursor (@cursor_ai) August 5, 2025

2. Windsurf 使用 Opus 4.1 的回饋與 benchmark

根據 Reddit 用戶回報，Windsurf 使用 Claude Opus 4.1 在其 junior developer benchmark 中得到與 Opus 4 相比約一個標準差的提升，與 Sonnet 3.7 到 Sonnet 4 的進步幅度相仿。另有用戶紀錄單次主要開發任務花費約 $7.3（Opus 4 標準費率）。

Claude Opus 4.1 is live in Windsurf. Let us know what you think! pic.twitter.com/Yz2yCpQT0G
— Windsurf (@windsurf) August 5, 2025

教學：還不清楚如何操作 Claude Code？

若你還不知道如何使用 Claude Code，或想體驗 Claude Code 中的新功能如 subagents，以下兩篇文章提供完整教程與操作示範，可點擊連結閱讀完整內容：

還不清楚如何操作 Claude Code？

如何透過 Claude Code 體驗當主管使用 subagents 新功能？

操作指南：如何在 Cursor 與 Windsurf 上切換到 Opus 4.1

Cursor 操作步驟

安裝並打開 Cursor 應用程式
前往 Settings → Models → 打開「Max Mode」選項
選擇 Claude Opus 型號（即 Opus 4.1）並輸入 Anthropic API key（或使用 OpenRouter 等代理）
於 AI Chat 或 Code 編輯區內即可選擇 Opus 4.1 模型開始互動與 refactor 流程。

Windsurf 使用提示

建議使用 Windsurf 的 dev mode 與 Claude 模型串接
開啟 tools，如 Cascade 自動續寫功能，以及根據 API key 使用 Opus 4.1 模型
利用 prompt 模板搭配 Claude Code 操作，以提升一次性複雜任務的成功率與效率。

安全性與風險評估

1. 模型持續沿用 Opus 4 安全等級

Opus 4.1 延續 Opus 4 的 AI Safety Level 3（ASL‑3）安全管理框架，實施更嚴格的安全測試與 alignment 控制，確保模型不會因小升級而降低安全性。

2. API 訪問政策緊縮

Anthropic 已在 2025 年 8 月初 撤銷 OpenAI 對 Claude 的全面 API 訪問權限，理由為 OpenAI 工程團隊內部使用 Claude Code 評估 GPT‑5，違反服務條款。Anthropic 強調非法定程序不得用於開發競爭模型，但仍保留 OpenAI 進行安全測試與 benchmark 的有限訪問權利。此舉反映 AI 公司間競爭走向更封閉與技術防禦的趨勢。

與 GPT‑5 的比較與預期挑戰

GPT‑5 將如何影響局勢？

外界普遍預期 OpenAI 將於 2025 年 8 月上旬推出 GPT‑5，該模型極可能在語言理解與多模態融合方面有顯著升級，對 Anthropic 的市場形成實質挑戰。若 GPT‑5 在編程能力或 agent task 上超越 Claude，則可能打亂 Anthropic 在企業市場的優勢地位。

本質定位與產品差異

Claude 強調專業程式開發場景與 agent 資訊整合
GPT 則偏重對話彈性、多模態支援與自然語言生成密度，尤其在消費者端（ChatGPT 用戶）具有優勢
有分析指出，若 GPT‑5 未提升 coding benchmark 表現，可能難撼動 Claude 在企業 coding 工具的領導地位

為什麼這次「小升級」值得業界關注？

企業主題戰略明確：Model 針對 coding、agent 任務優化，是 Anthropic 的差異化利基。
升級無痛導入：定價不變、兼容原系統，降低企業導入成本與阻力。
生態工具整合即時跟上：Cursor、Windsurf 等開發工具同步支援，提升 developer adoption。
策略性先發優勢：在 OpenAI GPT‑5 正式問世前出招，鞏固市場與媒體能見度。

總結

Claude Opus 4.1 雖然只是版本號的小幅提升，卻透過專業 coding、agent 任務與即時開發工具整合，深化 Anthropic 在企業 AI 市場的競爭優勢。面對即將登場的 GPT‑5，它不只是性能升級，更是一場市場定位與開發者工具生態的提前部署。

Source

官方發佈公告：https://www.anthropic.com/news/claude-opus-4-1

【科技新聞】Claude Opus 4.1 上線：GPT-5 還沒出手，Anthropic 靠寫程式反超 OpenAI？企業級 AI 模型完整分析一次看懂

Vicky Tsai