Claude Opus 4.5 上線:Anthropic 正面迎戰 GPT-5.1 與 Gemini 3

「AI 不是一個新搜尋引擎,而是正在成為整個網路的『新表層』。」
我想很多人都看過「網路冰山」這張圖。上方的 Surface Web 只占整體的 4%,指的是被 Google、Bing 這些搜尋引擎索引的公開網頁;越往下是 Deep Web(需要登入的資料庫、訂閱內容),再往下才是匿名協議的 Dark Web。
過去這張圖之所以經典,是因為它提醒我們:
你看到的網路,其實只是冰山最上面的一截。
但前幾天我在測試 ChatGPT Shopping 的功能時,
我突然意識到 ── AI 正在悄悄改寫這張冰山的結構。
AI 出現後,我每天待在 ChatGPT、Claude、Gemini 的時間,已經遠遠高於使用 Google。AI 成了我的主要入口,Google 則變成次要查證工具。這個使用習慣的改變,透漏了一個重要的訊息:「不直接接觸網路」將成為趨勢。
但 Surface Web 並沒有消失,只是他的角色已經從「人類的入口」變成「模型的入口」,以前我們會去看 Google 流量、AI 流量,把兩者當成互相競爭的入口指標;但如果 AI 正在成為新的表層,這個比較本身就錯位了。因為 Google 是「入口」,AI 是「界面」,兩者根本不是同一個維度。
當然,這些推論現在都還在發酵,我自己也很愛觀察傳統搜尋引擎 vs AI 之間的流量變化,所以寫這一段時是真的自相矛盾,但至少從我自己的使用行為看,AI 作為網路新表層的雛形,已經悄悄浮出水面。
接下來就讓我們回到本週的五件 AI 大事,搭配一段觀察筆記,
讓你不只是看熱鬧,也能看懂門道。
本周焦點事件
- Claude Opus 4.5 上線:Anthropic 正面迎戰 GPT-5.1 與 Gemini 3
- NVIDIA x 港大提出新方向:AI 不靠獨奏,靠「交響樂團」取勝
- 耐能智慧公布新一代 NPU:把邊緣 AI 推向大型模型時代
- AI 資料中心狂潮,美國建築業高薪爆發+大缺工
- 黑五 AI 創造出 142 億美元業績?線上創新高,但實體店完全不同命
Claude Opus 4.5 上線:Anthropic 正面迎戰 GPT-5.1 與 Gemini 3

Anthropic 上週正式推出最新旗艦模型 Claude Opus 4.5,直接對準 GPT-5.1 與 Gemini 3,成為目前 frontier model 競賽中最具攻擊性的更新之一。這次的版本不只是換個數字,而是把「性能、效率、價格」三個指標一起往上拉。

這次更新最大的亮點是首次突破 SWE-Bench Verified 80% 門檻,創下大模型在 coding benchmark 上的最佳紀錄,同時在工具使用、推理與問題拆解等多項測試中刷新自家與競品成績。從官方公布的 benchmark 來看,Opus 在多項任務上與 Gemini 3 打成平手,部分項目甚至直接超車。

Opus 4.5 被定位為「多代理人系統的協作中心」。它可以協調多個輕量 Haiku 模型分工處理不同任務,有點像把大型模型變成 multi-agent workflow 的「調度員」,進一步強化複雜任務的完成效率。
另外值得提的是,往往大家都要找各式各樣的方式在 Claude 上省 Token,這次 Opus 4.5 也是直接半價 (66%),但目前的價格仍是 OpenAI 的四倍左右。除了模型本身更新,Anthropic 也同步開放了:
- 無限長對話(Unlimited context)
- Claude Code 的桌面端版本
- Chrome 與 Excel 的擴充支援
Opus 4.5 的推出,剛好卡在 GPT-5.1 Pro 與 Gemini 3 接連發布後的密集窗口。
在這個 frontier model 週週更新的時代,Anthropic 選擇以更強性能、更低價格、更多集成 API 來迎戰市場,也正式把 Claude 推回與 OpenAI、Google 同等規模的第一線競賽位置。
觀察筆記
之前不管是線下小聚,還是我們辦的 Vibe Coding Workshop,總會有人在交流時間跟我們分享他「如何節省 Claude 費用」的各種秘技。聽到最多的是用 Gemini 把 spec 寫好,再交給 Claude code 做主線任務,最有趣的是有人建立一個模型工作流,沒付費的用便宜模型跑,有付費的交棒給 Claude。
但回到問題本身:為什麼這麼多人還是選擇用 Claude?
因為在複雜任務裡,Claude 的效率真的很難被取代。不是因為它「跑得快」,
而是因為 它能用更少的 token,完成更多的步驟,而且不太需要循環試錯。
尤其在 coding、推理、multi-step 任務、工具使用這些場景,你要它做的事情,不用你講第二次。而這件事本身,就是一種「我貴但我實在」的成本節省。
還想看更多嗎?完整內容只對註冊用戶開放喔!
點下方的免費 Subscribe,馬上加入我們~