Anthropic 推出 Claude Opus 4.7:強化程式碼與自主任務執行能力

Anthropic 於 2026 年 4 月 16 日(星期四)正式推出旗艦 AI 模型 Claude Opus 4.7,距離今年 2 月發布 Opus 4.6 僅 70 天,持續維持 Claude 4.x 世代的高速迭代節奏。

Anthropic 推出 Claude Opus 4.7:強化程式碼與自主任務執行能力

Opus 4.7 有哪些新功能?

Anthropic 表示,Claude Opus 4.7 在軟體工程、指令遵循、以及實際任務執行方面超越前代,是目前公開發布中最強大的模型。[1]

核心升級重點

  • 更深層多步驟推理:在更高的努力層級下進行更多思考,尤其在 Agentic 任務的後期回合表現顯著[2]
  • 自主長時間任務執行:可持續運行複雜工作流程,過程中無需大量人工介入[3]
  • Agent 團隊協作:多個 AI 模型同步協作,分別負責規劃、撰碼、測試、與優化[3]
  • 更多輸出 token:較 4.6 能生成更長、更完整的回應[2]
  • 安全誠信強化:在誠實性與提示注入防禦方面有所改善[2]
  • 差異化降低網路攻擊能力:Anthropic 在訓練階段主動降低模型的網路攻擊相關能力,同時保留防禦應用[1]

延續自 Opus 4.6 的規格

Opus 4.7 在高級軟體工程方面相比 Opus 4.6 有顯著進步,特別是在最困難的任務上表現突出。用戶反映能夠將他們最硬的編碼工作——那些過去需要密切監督的工作——放心交給 Opus 4.7 完成。Opus 4.7 能夠嚴謹而一致地處理複雜、耗時的任務,精確關注指令,並在回報結果前設計驗證自身輸出的方式。

該模型的視覺能力也大幅提升:能夠以更高分辨率識別圖像。在完成專業任務時更具品味和創意,能生成更高質量的界面、幻燈片和文件。儘管它的能力不如我們最強大的模型 Claude Mythos Preview——但它在一系列基準測試中的表現優於 Opus 4.6:

安全性與對齊

總體而言,Opus 4.7 的安全配置與 Opus 4.6 相似:我們的評估顯示欺騙、阿諛奉承和配合濫用等令人擔憂的行為發生率很低。在某些方面,例如誠實度和抵抗惡意「提示注入」攻擊的能力上,Opus 4.7 相比 Opus 4.6 有所改善;但在其他方面(例如在受管制物質的危害減低建議上傾向提供過度詳細的內容),Opus 4.7 表現略弱。我們的對齊評估得出結論,該模型「總體上表現良好且值得信賴,儘管在行為上還不夠完美」。值得注意的是,根據我們的評估,Mythos Preview 仍然是我們訓練過最對齊最好的模型。完整的安全評估內容已在《Claude Opus 4.7 系統卡》中詳細討論。

我們自動行為審計中的總體不對齊行為評分。在此評估中,Opus 4.7 相比 Opus 4.6 和 Sonnet 4.6 有適度改善,但 Mythos Preview 仍顯示出最低的不對齊行為率。

從 Opus 4.6 遷移到 Opus 4.7

Opus 4.7 是 Opus 4.6 的直接升級,但有兩項變更值得提前規劃,因為它們會影響 Token 使用量。首先,Opus 4.7 採用了更新的分詞器,改進了模型處理文字的方式。代價是相同的輸入可能會映射到更多的 Token——大約 1.0–1.35 倍,取決於內容類型。其次,Opus 4.7 在較高努力等級下思考更深入,特別是在代理式設定的後續輪次中。這提高了它在難題上的可靠性,但這也意味著它會產生更多的輸出 Token。

使用者可以透過多種方式控制 Token 使用量:使用努力參數、調整任務預算,或提示模型更加簡潔。在我們自己的測試中,整體效果是有利的——在內部編碼評估中,所有努力等級的 Token 使用量都有改善,如下所示——但我們建議在實際流量上測量差異。

定價與可用性

Anthropic 確認 Opus 4.7 的定價與 Opus 4.6 一致,維持每百萬輸入 token 5 美元、每百萬輸出 token 25 美元的水準。[1]

存取管道 狀態
Anthropic Claude 平台 ✅ 正式開放
Anthropic API ✅ 正式開放
Microsoft Azure ✅ 支援
Google Cloud ✅ 支援
Amazon AWS ✅ 支援

同步推出:AI 設計工具

除模型升級外,Anthropic 同步發布一款AI 驅動設計工具,讓技術與非技術用戶皆能透過自然語言提示,生成網站、簡報、登陸頁面與產品原型。[6]

此工具計劃直接競爭的對象包括:

  • Adobe(設計軟體龍頭)
  • Figma(UI/UX 設計平台)
  • Gamma(AI 簡報新創)
  • Google Stitch(Google 的 AI 設計工具)[6]

報導指出,該工具的重點功能包括將 AI 生成的程式碼轉換為可編輯的 Figma 設計檔,並與 Microsoft Word 及 PowerPoint 深度整合。[4]


競爭格局

Claude Code vs Cursor vs Copilotv



Opus 4.7 進入競爭激烈的頂尖 AI 市場。前代 Opus 4.6 在 SWE-bench Verified 上達到 80.8%,位居程式碼基準測試頂端,與 GPT-5.4、Gemini 3.1 Pro 並列。[3]

Anthropic 採用雙軌策略

  • Opus 4.7:商業公開模型,具備強大程式碼與自主任務能力
  • Claude Mythos:更強大的前沿模型,因網路安全疑慮目前不公開發布[1][3]

Project Glasswing:守護關鍵軟體安全


Project Glasswing graphic
Opus 4.7 的發布伴隨 Anthropic 早在 4 月初宣布的重大計畫——Project Glasswing,一項集結科技巨頭的頂尖網路安全聯盟。[7][8]

計畫核心:Claude Mythos Preview

Project Glasswing 的技術核心是 Claude Mythos Preview——一個 Anthropic 刻意不公開發布的前沿模型,原因在於其過於強大的網路攻擊潛力:[9]

  • 在測試中,Mythos 自主識別出所有主要作業系統與瀏覽器中數千個高嚴重性漏洞[7]
  • 包含一個埋藏 27 年的 OpenBSD 系統漏洞[10]
  • 模型曾自主設計四步驟瀏覽器漏洞,逸出數位沙箱[9]

合作夥伴名單

產業 合作夥伴
雲端平台 Amazon Web Services、Google Cloud、Microsoft Azure
硬體 Apple、Nvidia、Broadcom
資安企業 CrowdStrike、Palo Alto Networks、Cisco
金融 JPMorganChase
開源基金會 Linux Foundation

此外,Anthropic 另開放約 40 家管理關鍵軟體基礎設施的組織加入,並承諾提供高達 1 億美元的使用點數,以及 400 萬美元捐贈給開源安全組織。[7][8]

給資安專業人士的機會

具有合法網路安全需求的研究人員,可透過 Cyber Verification Program 申請使用這款限制性模型。[1]


Claude 4.x 世代發展時間軸

模型 發布時間 主要特色
Claude Opus 4 2025 年 5 月 全球最佳程式碼模型,首代 Claude 4[11]
Claude Opus 4.6 2026 年 2 月 100 萬 token 上下文視窗、強化 Agentic 任務[5]
Claude Opus 4.7 2026 年 4 月 更強自主任務、Agent 協作、安全強化[1]
Claude Mythos Preview 2026 年 4 月(限量) 零時差漏洞偵測,Project Glasswing 專屬[9]

展望

Anthropic 同時透露,程式碼庫洩漏事件中曝光的內部代號 Capybara(定位高於 Opus 級別)、Sonnet 4.8,以及帶有背景 Agent 系統「Karios」與 Undercover Mode 等 44 個功能旗標,暗示下一世代模型已在開發中。[12]

目前 Claude Opus 4.7 已透過所有 Anthropic 服務管道、API,以及 Microsoft、Google、Amazon 等雲端合作夥伴正式上線。[1]


資料來源:CNBC、Reuters、The Verge、Anthropic 官方公告、letsdatascience.com、kingy.ai

Read more