Anthropic 發布 Claude Opus 4.6：首款 Opus 級百萬 Token 上下文模型登場

Anthropic 於 2026 年 2 月 5 日正式發布 Claude Opus 4.6，這是該公司迄今最強大的 AI 模型，也是 Opus 系列首款支援 100 萬 Token 上下文視窗（Beta）的旗艦產品。相較前代 Opus 4.5 僅於 2025 年 11 月推出，此次更新週期明顯加速，顯示 Anthropic 在 AI Agent 領域的競爭策略

Philo

06 Feb 2026 — 7 min read

核心功能升級

更強大的程式碼處理能力

Claude Opus 4.6 在程式設計領域展現顯著進步：

更精準的任務規劃：能將複雜任務拆解為獨立子任務並行處理
更長時間的 Agent 任務執行：可持續進行長時間自動化工作流程
大型程式碼庫穩定性：處理數百萬行程式碼時表現更可靠
自我除錯與糾錯：透過強化的 code review 能力主動發現並修正錯誤

Replit 團隊評價：「Claude Opus 4.6 在 Agent 規劃上是巨大躍進，能將複雜任務拆解為獨立子任務、平行執行工具與子代理，並精準識別阻礙點。」

100 萬 Token 上下文視窗

這是 Opus 級模型首次支援如此大規模的上下文處理能力：

MRCR v2 基準測試：在 8 根「針」隱藏於 100 萬 Token 的測試中達到 76% 準確率，前代 Sonnet 4.5 僅 18.5%
Context Rot 問題改善：模型在長對話中維持性能的能力大幅提升
Context Compaction：自動摘要舊有上下文，避免觸及視窗限制

這項升級讓模型能夠處理約 75 萬字的文本，且不會出現過往模型常見的性能衰退問題。

Agent Teams 多代理協作

Claude Code 新增「Agent Teams」功能（研究預覽版），支援多個 AI Agent 同時協作：

自動分析任務並識別可獨立執行的子任務
生成專門處理不同組件的子代理
工具與代理平行運行，主代理負責協調結果
適合程式碼審查等需要大量閱讀的獨立任務

Anthropic 產品負責人 Scott White 形容：「就像擁有一支才華洋溢的人類團隊為你工作，各自負責一塊並直接協調，平行運作更快速。」

0:00

/1:27

技術規格與定價

規格項目	數值
上下文視窗	100 萬 Token（Beta）
最大輸出 Token	128,000
標準定價（輸入）	$5 / 百萬 Token
標準定價（輸出）	$25 / 百萬 Token
長上下文定價（>200k）	$10 / $37.50 / 百萬 Token
美國專屬推論	1.1× 定價

新 API 功能

Adaptive Thinking 自適應思考

模型可根據上下文線索自行決定是否需要深度推理，開發者不再只能二選一開啟或關閉擴展思考功能。

Effort 控制參數

提供四個努力等級供開發者調整：

Low：快速回應簡單查詢
Medium：大多數使用情境的平衡選擇
High（預設）：最大能力，但可能對簡單任務過度思考
Max：極致推理能力

如果發現模型在某些任務上過度思考，可透過 /effort 參數將等級調低至 medium 。

基準測試表現

Claude Opus 4.6 在多項評測中取得業界領先成績：

基準測試	分數	說明
Terminal-Bench 2.0	65.4%	Agent 程式設計基準，業界最高
Humanity's Last Exam	53.1%（含工具）	複雜多學科推理測試，領先所有競爭對手
GDPval-AA	1,606 Elo	知識工作評估，領先 GPT-5.2 達 144 分
BrowseComp	84%	線上資訊檢索能力測試
Finance Agent	第一名	金融分析師任務基準
BigLaw Bench	90.2%	法律推理能力，Claude 模型最高分

產品整合更新

Claude in Excel

強化長時間與複雜任務的處理能力：

執行前可先規劃行動
自動推斷非結構化資料的正確格式
單次處理多步驟變更

Claude in PowerPoint（研究預覽）

全新推出的 PowerPoint 整合功能：

讀取版面配置、字型與投影片母片以維持品牌一致性
可從範本建立或根據描述生成完整簡報
適用於 Max、Team 與 Enterprise 方案

0:00

/0:39

安全性提升

Anthropic 表示 Claude Opus 4.6 通過該公司有史以來最全面的安全評估：

自動行為審計顯示低比率的不當行為（欺騙、奉承、配合濫用等）
整體安全性與前代 Opus 4.5 相當或更佳
過度拒絕率為近期 Claude 模型中最低
新增六項網路安全探測器，追蹤潛在濫用形式

由於 Opus 4.6 展現強化的網路安全能力，Anthropic 已利用該模型協助發現並修補開源軟體漏洞，在正式發布前已發現超過 500 個零日漏洞 。

市場背景與競爭態勢

此次發布並非偶然。OpenAI 於三天前推出 Codex 桌面應用程式，直接瞄準 Claude Code 的市場動能。與此同時，軟體類股因投資人擔憂 AI 顛覆而下跌 2,850 億美元。

Claude Code 在正式上線僅六個月後，年化營收已達 10 億美元 。Anthropic 的 Claude Relations 負責人 Alex Albert 表示，這次發布代表「AI 成為那些整天處理試算表、簡報與長文件的人們真正工作夥伴的分水嶺時刻」。

使用方式

Claude Opus 4.6 現已開放使用：

claude.ai：直接透過網頁介面使用
Claude API：使用模型代碼 claude-opus-4-6
主要雲端平台：包括 AWS、Google Cloud 等

Anthropic 發布 Claude Opus 4.6：首款 Opus 級百萬 Token 上下文模型登場

Philo

核心功能升級

更強大的程式碼處理能力

100 萬 Token 上下文視窗

Agent Teams 多代理協作

技術規格與定價

新 API 功能

Adaptive Thinking 自適應思考

Effort 控制參數

基準測試表現

產品整合更新

Claude in Excel

Claude in PowerPoint（研究預覽）

安全性提升

市場背景與競爭態勢

使用方式

延伸閱讀

Read more

ChatGPT 成人模式涼了！OpenAI 再次喊卡，一周砍了三個計畫

2026 還在找代辦申請海外學校？我用 AI 投遞 25 間美研，拿下 CMU、Duke 等頂級 Offer 的流程

Claude Projects 完整教學：不懂技術也能打造專屬 AI 助理

【設計師的 AI 秘笈】Figma MCP 開放 Beta，4步驟一鍵產出代碼

核心功能升級

更強大的程式碼處理能力

100 萬 Token 上下文視窗

📬 免費訂閱AI 郵報和我們一起探索！

Agent Teams 多代理協作

技術規格與定價

新 API 功能

Adaptive Thinking 自適應思考

Effort 控制參數

基準測試表現

產品整合更新

Claude in Excel

Claude in PowerPoint（研究預覽）

安全性提升

市場背景與競爭態勢

使用方式

延伸閱讀

📬 免費訂閱AI 郵報和我們一起探索！

Read more

ChatGPT 成人模式涼了！OpenAI 再次喊卡，一周砍了三個計畫

2026 還在找代辦申請海外學校？我用 AI 投遞 25 間美研，拿下 CMU、Duke 等頂級 Offer 的流程

Claude Projects 完整教學：不懂技術也能打造專屬 AI 助理

【設計師的 AI 秘笈】Figma MCP 開放 Beta，4步驟一鍵產出代碼

📬 免費訂閱AI 郵報
和我們一起探索！

📬 免費訂閱AI 郵報
和我們一起探索！