AI 寫 code、AI 審 code,工程師的下一步是什麼?Claude Code Review 正式登場

AI 寫 code、AI 審 code,工程師的下一步是什麼?Claude Code Review 正式登場

本週大家都在爭論 AI 發展是否已經撞上「算力之牆」,但 OpenAI 的研究員 Noam Brown 很自豪地說出了 "We see no wall" ,並推出 GPT-5.4,標榜的是「超越人類控制電腦的能力」(必須說,我個人對於 Computer use 的想法是捨近求遠) 。

然而,當技術端宣告無上限進化的同時,Anthropic 的最新研究卻揭露了一個更殘酷的現實:AI 確實還沒開始大規模裁員,但職場新鮮人的求職入口已經被這堵「看不見的牆」擋住了。

接著馬上讓我們進入本週的五件 AI 大事,搭配觀察筆記
讓你不只是看熱鬧,也能看懂門道。


AIPost Academy:影響力講師合作計畫(限額審核)

與其擔心被自動化取代,不如成為定義自動化的人。

AI 郵報學院正式啟動「首批影響力講師計畫」。我們不找只會教 Prompt 的人,我們要找的是能將 AI 轉化為企業生產力、具備實務落地能力的專家。這不只是一場課程合作,更是一套具備「專業審核 × 認證價值」的 AI 課程體系。

加入我們,你將獲得:

  • 專業背書:具備第三方機構認可的能力證明,讓你的專業不只是口頭說說。
  • 職涯紀錄:可供企業培訓、內部應用與能力評估的權威證書。
  • 長期佈局:優先納入後續企業培訓與跨域合作的種子名單。

👉 [立即提交合作意願初審表單]
(本計畫採取領域限額與滾動式審核,如果你擅長的是 AI 落地實務,我們在找的就是你。)


本周焦點事件

  1. AI 寫 code、AI 審 code,工程師的下一步是什麼?Claude Code Review 正式登場
  2. 營收全公開!TrustMRR 揭秘「OpenClaw」變現浪潮:單月狂捲 29 萬美元
  3. 【實戰工作坊】0 成本打造 AI 數位助手:Google AI Studio x Gemini 實戰工作坊
  4. 桌面操作首度超越人類!OpenAI 發表 GPT-5.4,強勢回應「AI 撞牆論」
  5. 新鮮人的寒冬:Anthropic 數據揭秘,22-25 歲求職進入率為何慘跌 14%?

AI 寫 code、AI 審 code,工程師的下一步是什麼?Claude Code Review 正式登場

src: Claude

根據 Anthropic 官方部落格最新消息,這家 AI 巨頭正式發表了專為開發者設計的新工具:Claude Code Review。這項功能目前已在 Claude Team 與 Enterprise 方案中開啟「研究預覽版」,目的是解決 AI code 量產後,人類工程師卻來不及審查的瓶頸。

核心細節與技術規格

  • 運作機制: 採用「多代理人(Multi-agent)」架構。當開發者提交 Pull Request(PR)時,系統會自動派出多個 AI 代理人同時掃描代碼,涵蓋邏輯漏洞、數據流追蹤與安全性評估。大型或複雜的 PR 會分配更多代理人做更深的審查,小改動則輕量處理,平均審查時間約 20 分鐘。
  • 關鍵功能:
    • 深度審查: 不同於以往簡單的語法檢查,Claude Code Review 模擬資深工程師的思維,捕捉隱藏在複雜異步呼叫或單行改動中的邏輯錯誤。例如,一個看似常規的單行改動,可能會導致生產環境的身份認證失效,而工具能將其標記為高風險問題。
    • 智能降噪: 多個代理人會互相驗證發現的問題,過濾掉無意義的誤報,並根據嚴重程度自動排序。Anthropic 指出,在超過 1000 行改動的大型 PR 中,平均每個 PR 能找出 7.5 個問題,其中不到 1% 的發現被標記為誤報。
  • 部署背景:過去一年,Anthropic 內部工程師的代碼產出提升了 200%,傳統人工審查已無法負荷。使用前,只有 16% 的 PR 能收到實質性審查意見;使用後,這個比例升至 54%。內部實戰中,Claude Code Review 成功攔截過連資深工程師都漏掉的關鍵驗證漏洞。
Claude Opus 4.6 在 2026 年 2 月共發現了 22 個漏洞,這比 2025 年任何單一月份所回報的數量還要多。

在正式推出前夕,Anthropic 與 Mozilla 合作,於 Firefox 瀏覽器中在兩週內揪出了 22 個漏洞,其中高達 14 個被評定為「高風險」Bug。Claude 僅花 20 分鐘就抓到第一個記憶體漏洞,單月回報量甚至超過 Firefox 2025 年任何一個月份的總和。研究顯示,找出這些漏洞的 API 成本僅約 4,000 美元,遠低於聘請頂級安全專家所需的人力資源。

對比一般科技公司的網路安全投入,Mozilla 這類瀏覽器級企業,每年光安全人力、Bug Bounty 與工具就可能支出 500–1,000 萬美元。換句話說,Claude Code Review 所帶來的成本效率,遠高於傳統方式;花不到一個月的人力預算,就能抓到大量高風險漏洞,補上人工審查的盲區。

觀察筆記

過去我們擔心 AI 寫出的代碼品質參差不齊,不能進 production,而現在 Anthropic 給出的解法是用「更強的 AI」來把關。這確實能解放工程師從枯燥的逐行檢查中脫離,轉向更高階的架構設計;但換個角度看,如果連「審查權」都交給 AI,junior 工程師透過 Review 前輩代碼來學習成長的機會可能會大幅萎縮。

此外,效率的另一面,是成本。這種「多代理人」模式雖然精準,但也意味著極高的運算成本,也解釋了為什麼它目前僅限於高階訂閱用戶。在追求效率的開發環境下,我們是否會過度依賴 AI 的綠燈,畢竟面對這種便宜又大碗,「花不到一個月人力預算就能抓到大量 Bug」的誘惑,實在難以抵抗,而且數據的說服力實在太強兩。也許未來每家公司的標配,會是一個永遠在線的「數位第十一人」:不參與開發、不寫任何一行 code,卻專門負責對所有人的產出潑冷水、挑毛病,確保團隊不會在效率的慣性裡集體踩雷。

還想看更多嗎?完整內容只對註冊用戶開放喔!
點下方的免費 Subscribe,馬上加入我們~

營收全公開!TrustMRR 揭秘「OpenClaw」變現浪潮:單月狂捲 29 萬美元

src : TrustMRR

如果你還在懷疑 AI 代理(Agent)能不能賺錢,TrustMRR 剛上線的 OpenClaw 專屬分類(Special Category)給出了最直接的答案。這些與 OpenClaw 有關的應用都是透過 Stripe API 即時驗證的真金白銀,所以在這裡不需要擔心造假(望向近期很紅的Cluely CEO 偽造收益)。

核心細節與變現數據

  • 即時戰績: 目前榜單上已有 132 個 OpenClaw 相關項目,最近 30 天的總收入突破 $290K(約 950 萬台幣)
  • 指標性項目: 榜首項目的月收入高達 $51K(約 165 萬台幣)
  • 低門檻、高收益的「賣水人」模式: 這些高收益產品的邏輯其實異常簡單,大多環繞著 OpenClaw 的基礎建設:
    • 一鍵部署服務: 解決開發者環境建置的痛點。
    • AI Agent 代管(Hosting): 提供穩定的執行環境。
    • 教育實戰課: 教人如何駕馭這套工具。
    • 硬體周邊: 甚至有人直接販售預載好環境的「AI 電腦」。

觀察筆記

自從開始研究 AI 工具以來,「靠 AI 搞副業」一直是熱度最高的領域。我相信只要身邊的人知道你在鑽研 AI,一定會有人跑來問你:這東西到底能不能變現?

TrustMRR 的榜單給的答案是「可以」,而且是「幫別人把工具跑起來」這種賣鏟子的人。這群被稱為「龍蝦族」的創業者,精準捕捉到了 OpenClaw 的部署門檻。這些項目本質上只做一件事:把複雜的技術變簡單。當大家還在糾結環境建置時,他們已經靠著「一鍵部署」或「代管服務」把第一桶金賺進口袋。

不過,這種基於單一開源項目的營收爆發,也存在隱憂。TrustMRR 的透明度雖然證明了變現潛力,卻也像血水一樣引來無數競爭者。當「一鍵部署」變得隨處可見,這群創業者的護城河就必須從純粹的技術服務,轉向品牌力或更深的社群信任。

對我們這些觀察者來說,TrustMRR 是一個極佳的創業實戰圖書館。它讓我們跳過那些虛無飄渺的 Prompt 技巧,直擊市場最願意掏錢的「剛需」到底在哪裡。


【實戰工作坊】0 成本打造 AI 數位助手:Google AI Studio x Gemini 實戰工作坊

如果你對 AI 的想像還停留在對話框,這場由 Google 認證教育家 Andrew Shih(育廷) 主導的 Workshop 將打破你的認知。不需要支付昂貴的伺服器月費,也不必糾結複雜的程式碼。活動核心在於利用 Google 生態系(Docs, Sheets, Drive)串聯 Gemini,實現真正的「全自動工作流」。

這場 Workshop 你將學到:

  • GenAI in Chatbot:讓 AI 助手從「會說話」進化到「會做事」。
  • Google 生態系深度整合:自動化批量撰寫文案、整理數據、一鍵生成圖表。
  • 免主機 Line Bot 部署:實現 0 成本自動化,徹底告別每個月的付費模組。
  • Vibe Coding 實戰:透過互動式生成建置程式碼,新手也能快速除錯並發布上線。

誰適合參加?

  • 行政與 PM 效率控:處理大量文書資料到心累,渴望用自動化解放雙手。
  • 創新教育工作者:想製作吸睛教材,或為班級建立專屬機器人的老師。
  • 預算有限的創業家:需要免費且強大的工具來處理客服與行銷內容。
  • AI 自動化好奇人類:想用最少資源發揮最大 AI 戰力的人。

活動資訊

  • 時間:2026/3/18(週三)14:00 - 15:00
  • 講者:Andrew Shih(中教大博士候選人 / Google 認證教育家)
  • 形式:線上直播 + 即時實作(報名審核後取得連結)
  • 超值附贈:Line Bot 基礎教材 + Workshop 實作範本
  • 報名連結

事前準備

建議準備 Google 帳號、Line 官方帳號與 Gemini API(現場也會引導如何申請)。


桌面操作首度超越人類!OpenAI 發表 GPT-5.4,強勢回應「AI 撞牆論」

src: OAI

根據 OpenAI 最新消息,公司正式推出旗艦模型 GPT-5.4。這是繼 GPT-5.3 Instant 發布僅兩天後的重量級更新。OpenAI 科學副總裁 Kevin Weil 稱其為「公司史上最強模型」,在桌面任務、程式開發、科學推理及數學領域皆有顯著提升。

核心細節與技術規格

  • 上市與版本: 目前已向 Plus、Team 與 Pro 用戶推出「GPT-5.4 Thinking」模式,作為主力模型。
  • 關鍵功能與指標:
    • 超越人類的桌面導航:OSWorld-V 基準測試(模擬真實電腦桌面操作)中取得 75% 的成功率,正式超越人類基準線(72.4%),性能更是前代 GPT-5.2 的兩倍。
    • 專業知識對等:GDPval(涵蓋 44 種職業的知識工作測試)中,GPT-5.4 在 83% 的情況下與專業人士持平或勝出,較 5.2 版本的 71% 大幅進步。
    • 長程推理與上下文: 支援高達 1M(100 萬)Tokens 的上下文視窗,並新增「x-high」推理強度設定,允許 AI Agent 進行長達數小時的複雜任務規劃與執行。
  • 開發聲明: 針對近期市場對 AI 性能增長放緩的擔憂,OpenAI 研究員 Noam Brown 霸氣宣告:「我們沒看到牆(We see no wall)。」
GPT-5.4 Boosts AI Capabilities for Economic Growth | Noam Brown posted on the topic | LinkedIn
GPT-5.4 is a big step up in computer use and economically valuable tasks (e.g., GDPval). We see no wall, and expect AI capabilities to continue to increase dramatically this year.

觀察筆記

GPT-5.4 在桌面操作(Computer Use)超越人類,固然在數據上很驚人,但我其實對這個技術方向抱持高度懷疑。

我們真的需要一個「會操作滑鼠」的 AI 嗎?

目前 AI 廠商引以為傲的,是 Agent 點擊圖標、導航桌面比人類更快,但這在本質上可能走錯了路。人類之所以需要點開「D 槽 > 工作資料夾 > 報告.pdf」,是因為我們受限於圖形介面(GUI)的物理結構;但對 AI 來說,它本來就應該透過指令(CLI)或 API 直接與系統底層對話。

就像瀏覽網站,一個聰明的 Agent 應該是直接抓取後端數據,而不是像人類一樣在那邊滾動頁面、尋找按鈕。讓 AI 去模擬人類的「操作路徑」,雖然看起來很像科幻電影裡的數位員工,但實際上卻是捨近求遠,把最先進的算力浪費在最沒效率的互動方式上。

當 Noam Brown 霸氣宣告「沒看到牆」的時候,我看到的反而是另一道牆:我們是否為了追求讓 AI「看起來像人」,而限制了它作為「原生數位生命」應有的效率?比起一個會幫我點滑鼠的 GPT-5.4,我更期待一個能直接接管 API、跳過所有繁瑣介面的隱形作業系統。


Anthropic 最新研究:AI 還沒搶走你的工作,但年輕白領已經更難被錄取了

Anthropic 最新研究:AI 還沒搶走你的工作,但年輕白領已經更難被錄取了

Anthropic 於 2026 年 3 月 5 日發布了一份重量級勞動市場研究。這份報告提出了一個新指標:「觀察式曝險(Observed Exposure)」。這個指標很有趣,我們過去可能看到 Tesla FSD / Waymo 自駕的功能上線或在某一州試營運,我們很可能就會產生「完蛋了,司機要失業了」這種想法;但觀察式曝險指標是直接去看 Claude 的後台數據,看現在「實際有多少人在用 AI 幫忙開車?開了多久?哪些路段已經全自動了?」來作為「某個職業可能因為 AI 覆蓋率偏高,而面臨失業風險」

研究結論雖然顯示目前尚未出現系統性的失業潮,但對於 22 至 25 歲的職場新鮮人來說,警報已經拉響。

誰是第一線高風險人員?

  • 觀察式曝險 vs. 理論天花板: 以電腦與數學類職務為例,理論上 AI 能處理 94% 的任務,但目前在真實場景的覆蓋率約為 33%。這段落差來自於法規限制、軟體整合門檻以及對人類驗證的需求。
  • 高曝險職業排行:
    1. 電腦程式設計師: 任務覆蓋率達 75%
    2. 客服代表: 覆蓋率 70.1%
    3. 資料輸入員: 覆蓋率 67.1%
  • 白領大於藍領: 這次受衝擊最深的是高薪、高教育程度的辦公室白領(尤其是女性與亞裔群組),而廚師、酒保、救生員等體力勞動者的 AI 曝險幾乎為零。

喜歡這期內容嗎?有哪一則讓你特別有感?
歡迎回信或是 Instagram 告訴我們,我們會偷偷讀大家的回覆的!

我們下周見
—AI郵報 編輯團隊

Read more

Cortical Labs 開設全球首座「人腦細胞驅動」資料中心:活體神經元取代傳統晶片,顛覆 AI 運算未來

Cortical Labs 開設全球首座「人腦細胞驅動」資料中心:活體神經元取代傳統晶片,顛覆 AI 運算未來

澳洲生物科技新創公司 Cortical Labs 於 2026 年 3 月 10 日正式宣布,在澳洲墨爾本揭幕全球首座生物資料中心,並同步與新加坡合作夥伴 DayOne Data Centers 啟動第二座設施建設。這些資料中心不使用傳統矽晶片,而是以實驗室培養的「活體人類腦細胞」作為運算核心——這是人類首次將「濕件運算(Wetware Computing)」技術部署於商業資料中心環境中。