Anthropic 發布 Claude Opus 4.6:首款 Opus 級百萬 Token 上下文模型登場

Anthropic 於 2026 年 2 月 5 日正式發布 Claude Opus 4.6,這是該公司迄今最強大的 AI 模型,也是 Opus 系列首款支援 100 萬 Token 上下文視窗(Beta)的旗艦產品 ​。相較前代 Opus 4.5 僅於 2025 年 11 月推出,此次更新週期明顯加速,顯示 Anthropic 在 AI Agent 領域的競爭策略

Anthropic 發布 Claude Opus 4.6:首款 Opus 級百萬 Token 上下文模型登場

核心功能升級

更強大的程式碼處理能力

Claude Opus 4.6 在程式設計領域展現顯著進步 ​:

  • 更精準的任務規劃:能將複雜任務拆解為獨立子任務並行處理
  • 更長時間的 Agent 任務執行:可持續進行長時間自動化工作流程
  • 大型程式碼庫穩定性:處理數百萬行程式碼時表現更可靠
  • 自我除錯與糾錯:透過強化的 code review 能力主動發現並修正錯誤

Replit 團隊評價:「Claude Opus 4.6 在 Agent 規劃上是巨大躍進,能將複雜任務拆解為獨立子任務、平行執行工具與子代理,並精準識別阻礙點。」​

100 萬 Token 上下文視窗

這是 Opus 級模型首次支援如此大規模的上下文處理能力 ​:

  • MRCR v2 基準測試:在 8 根「針」隱藏於 100 萬 Token 的測試中達到 76% 準確率,前代 Sonnet 4.5 僅 18.5%
  • Context Rot 問題改善:模型在長對話中維持性能的能力大幅提升
  • Context Compaction:自動摘要舊有上下文,避免觸及視窗限制 ​

這項升級讓模型能夠處理約 75 萬字的文本,且不會出現過往模型常見的性能衰退問題 ​。

Agent Teams 多代理協作

Claude Code 新增「Agent Teams」功能(研究預覽版),支援多個 AI Agent 同時協作 ​:

  • 自動分析任務並識別可獨立執行的子任務
  • 生成專門處理不同組件的子代理
  • 工具與代理平行運行,主代理負責協調結果
  • 適合程式碼審查等需要大量閱讀的獨立任務

Anthropic 產品負責人 Scott White 形容:「就像擁有一支才華洋溢的人類團隊為你工作,各自負責一塊並直接協調,平行運作更快速。」​

0:00
/1:27

技術規格與定價

規格項目數值
上下文視窗100 萬 Token(Beta)
最大輸出 Token128,000 
標準定價(輸入)$5 / 百萬 Token 
標準定價(輸出)$25 / 百萬 Token 
長上下文定價(>200k)$10 / $37.50 / 百萬 Token 
美國專屬推論1.1× 定價 

新 API 功能

Adaptive Thinking 自適應思考

模型可根據上下文線索自行決定是否需要深度推理,開發者不再只能二選一開啟或關閉擴展思考功能 ​。

Effort 控制參數

提供四個努力等級供開發者調整 ​:

  • Low:快速回應簡單查詢
  • Medium:大多數使用情境的平衡選擇
  • High(預設):最大能力,但可能對簡單任務過度思考
  • Max:極致推理能力

如果發現模型在某些任務上過度思考,可透過 /effort 參數將等級調低至 medium ​。


基準測試表現

Claude Opus 4.6 在多項評測中取得業界領先成績 ​:

基準測試分數說明
Terminal-Bench 2.065.4%Agent 程式設計基準,業界最高 
Humanity's Last Exam53.1%(含工具)複雜多學科推理測試,領先所有競爭對手 
GDPval-AA1,606 Elo知識工作評估,領先 GPT-5.2 達 144 分 
BrowseComp84%線上資訊檢索能力測試 
Finance Agent第一名金融分析師任務基準 
BigLaw Bench90.2%法律推理能力,Claude 模型最高分 

產品整合更新

Claude in Excel

強化長時間與複雜任務的處理能力 ​:

  • 執行前可先規劃行動
  • 自動推斷非結構化資料的正確格式
  • 單次處理多步驟變更

Claude in PowerPoint(研究預覽)

全新推出的 PowerPoint 整合功能 ​:

  • 讀取版面配置、字型與投影片母片以維持品牌一致性
  • 可從範本建立或根據描述生成完整簡報
  • 適用於 Max、Team 與 Enterprise 方案
0:00
/0:39

安全性提升

Anthropic 表示 Claude Opus 4.6 通過該公司有史以來最全面的安全評估 ​:

  • 自動行為審計顯示低比率的不當行為(欺騙、奉承、配合濫用等)
  • 整體安全性與前代 Opus 4.5 相當或更佳
  • 過度拒絕率為近期 Claude 模型中最低
  • 新增六項網路安全探測器,追蹤潛在濫用形式

由於 Opus 4.6 展現強化的網路安全能力,Anthropic 已利用該模型協助發現並修補開源軟體漏洞,在正式發布前已發現超過 500 個零日漏洞 ​。


市場背景與競爭態勢

此次發布並非偶然。OpenAI 於三天前推出 Codex 桌面應用程式,直接瞄準 Claude Code 的市場動能 ​。與此同時,軟體類股因投資人擔憂 AI 顛覆而下跌 2,850 億美元 ​。

Claude Code 在正式上線僅六個月後,年化營收已達 10 億美元 ​。Anthropic 的 Claude Relations 負責人 Alex Albert 表示,這次發布代表「AI 成為那些整天處理試算表、簡報與長文件的人們真正工作夥伴的分水嶺時刻」​。


使用方式

Claude Opus 4.6 現已開放使用 ​:

  • claude.ai:直接透過網頁介面使用
  • Claude API:使用模型代碼 claude-opus-4-6
  • 主要雲端平台:包括 AWS、Google Cloud 等

延伸閱讀