Claude Opus 4.7 正式發布:程式碼、視覺雙升級,定價不變

Anthropic 於 2026 年 4 月 16 日發布 Claude Opus 4.7,SWE-bench Pro 拿下 64.3% 領先 GPT-5.4 與 Gemini 3.1 Pro,圖片解析度提升三倍,定價不變維持 $5/$25。但新版 tokenizer 最多讓實際成本增加 35%,升級前務必確認。

Claude Opus 4.7 正式發布:程式碼、視覺雙升級,定價不變

Anthropic 於 2026 年 4 月 16 日正式發布 Claude Opus 4.7,這是目前對外公開的最強 Claude 模型。程式碼能力與視覺解析度雙雙大幅提升,定價維持不變,但底層 tokenizer 異動讓實際使用成本有所不同,需要留意。

Opus 4.7 的核心升級是什麼

Claude Opus 4.7 是指 Anthropic 在 Opus 4.6 基礎上推出的新一代旗艦模型,model ID 為 claude-opus-4-7,主打三大方向:更強的程式碼解決能力、更高的視覺解析度,以及在長時間自主任務中更穩定的執行品質。

根據 Anthropic 官方公告,Opus 4.7 在進階軟體工程任務上有「顯著提升」,尤其在過去需要人工緊盯的高難度任務上,用戶回報可以放心交手。模型在執行時會主動自我驗證輸出結果,減少需要人為介入糾錯的情況。

值得注意的是,Anthropic 在公告中明確說明:Opus 4.7 的能力仍低於目前未對外公開的 Claude Mythos Preview,後者因安全疑慮僅提供給少數特定企業使用。

程式碼能力:跨平台數據全面領先

程式碼能力是 Opus 4.7 改幅最大的面向。在業界標準測試 SWE-bench Verified(模擬解決真實 GitHub issue)上,Opus 4.7 拿下 87.6%,較 Opus 4.6 的 80.8% 提升近 7 個百分點。

Claude Opus 4.7 benchmark comparison

Image Credits: Anthropic

難度更高的 SWE-bench Pro 測試中,Opus 4.7 以 64.3% 居所有公開模型之首,超越 GPT-5.4 的 57.7% 與 Gemini 3.1 Pro 的 54.2%。在 Cursor IDE 內部的 CursorBench 測試上,分數從 58% 提升至 70%,上升 12 個百分點。

來自企業端的實測數據同樣具體。Rakuten 回報解決生產環境任務的數量是 Opus 4.6 的三倍;CodeRabbit 在複雜 PR 的召回率提升逾 10%;另一家金融科技平台指出,Opus 4.7 能在規劃階段自主發現邏輯錯誤,大幅降低後期除錯成本。

另外,Opus 4.7 同步新增兩項開發者工具:Claude Code 中的 /ultrareview 指令,可啟動多 Agent 協作進行程式碼審查;以及目前處於公開 Beta 的 Task Budgets,讓開發者可以為 Agent 的執行迴圈設定步數上限,避免無限循環消耗資源。

視覺能力:解析度直接翻三倍

視覺理解是 Opus 4.7 另一個大幅升級的面向。圖片解析度從 Opus 4.6 的 1,568px(約 1.15MP)提升至 2,576px(約 3.75MP),等於提升了三倍以上的像素資訊量。

實際視覺準確度測試(visual-acuity benchmark)從原本的 54.5% 跳升至 98.5%,這對需要模型讀取截圖、UI 介面、設計稿或文件圖片的任務來說影響顯著。Anthropic 在公告中也特別提到,Opus 4.7 在生成介面、簡報和文件時展現出更強的設計品味與創作質感。

定價不變,但 tokenizer 異動讓實際成本可能偏高

Opus 4.7 的官方定價維持與 Opus 4.6 相同:輸入 $5 / 輸出 $25(每百萬 token)。對於已在使用 Claude 的企業或開發者,這是一個直接升級而無需重新評估預算的訊號。

不過有一點需要留意:Opus 4.7 更換了底層 tokenizer,同樣的文字輸入在新版本下可能產生 1.0 到 1.35 倍的 token 數,也就是說實際帳單最多可能增加 35%。此外,過去用於控制思考深度的 extended thinking budgetsbudget_tokens 參數)已被移除,現在改由「Adaptive Thinking」自動決定推理深度,使用者無法像之前一樣手動設定上限。

資安設計:新模型率先測試 Mythos 的防護機制

Opus 4.7 還扮演了一個特別角色:它是 Anthropic 首個搭載新版資安防護機制的對外模型,系統會自動偵測並攔截涉及高風險資安用途的請求。

這項設計的背景是:Anthropic 在 Mythos Preview 上發現該模型具有強大的漏洞挖掘能力,決定先在能力較低的 Opus 4.7 上測試防護邏輯,累積真實部署經驗後再推進至 Mythos 等級的模型。合法的資安研究人員(如漏洞測試、紅隊演練)可透過 Cyber Verification Program 申請驗證,取得對應的使用權限。

Opus 4.7 vs 競品與前代版本完整比較

測試項目 Opus 4.6 Opus 4.7 GPT-5.4 Gemini 3.1 Pro
SWE-bench Verified 80.8% 87.6% 80.6%
SWE-bench Pro 53.4% 64.3% 57.7% 54.2%
CursorBench 58% 70%
GPQA Diamond 94.2%
圖片解析度 1,568px 2,576px
輸入定價(/M tokens) $5 $5
輸出定價(/M tokens) $25 $25

在哪裡可以使用 Opus 4.7

Opus 4.7 目前已在以下平台全面上線,無需等候名單:

  • Claude.ai:Pro、Max、Team、Enterprise 方案
  • Anthropic API:model ID claude-opus-4-7
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Microsoft Foundry
  • Snowflake Cortex AI
  • GitHub Copilot(Pro+、Business、Enterprise)

對於已在使用 Claude 處理企業級程式碼任務的團隊,Opus 4.7 是目前可直接部署的最強選項,不需要等待名單或特殊申請。唯一需要確認的是新 tokenizer 對現有 prompt 的 token 用量影響,建議升級前先以實際使用的 prompt 跑一次成本估算。


想每週掌握最新 AI 工具與趨勢?訂閱 AI 郵報,每週精選重點直送信箱,讓你不錯過任何重要動態。


資料來源

Read more