Loop Engineering 是什麼？從 Prompt Engineering 進化到 AI 迴圈工程

當大家還在學怎麼寫好 Prompt，Google 工程師已經開始談「Loop Engineering」。這是一種用自動化迴圈取代人工提示 AI 的新工程方法：設計會自己尋找任務、提示 Agent、驗證結果並記錄狀態的 AI 工作流，正在改變工程師與 AI 協作的方式。

「我不再直接提示 Claude 了。我讓迴圈跑著去提示 Claude、自己決定要做什麼。我的工作是寫迴圈。」
— Boris Cherny，Anthropic Claude Code 負責人

Here’s your monthly reminder that you shouldn’t be prompting coding agents anymore.

You should be designing loops that prompt your agents.
— Peter Steinberger 🦞 (@steipete) June 7, 2026

2026 年 6 月，這段話在工程師社群炸開了。

Claude Code 的創造者在訪談裡宣告了一件事：他已經不再親自輸入提示詞給 AI。他的日常工作，變成了「設計讓 AI 自己去工作的系統」。這不是一個工具技巧的升級，而是一整個思維模式的轉換。

這個概念迅速引爆討論，一週之內，Google 工程師 Addy Osmani 在自己的部落格上為它命名——Loop Engineering（迴圈工程）——並系統性地拆解出五個積木，讓這個概念從「工程師的私房心法」變成了人人可學的方法論。

這篇文章會用白話把 Loop Engineering 從頭到尾講清楚：它到底是什麼、五個積木各自解決什麼問題、實際怎麼建出第一個迴圈，以及它的三個最大陷阱。無論你是工程師、PM、還是內容創作者，這套思維都與你有關。

一、為什麼突然所有人都在談 Loop Engineering？

三個獨立信號，指向同一個方向

這波浪潮不是憑空冒出來的。2026 年上半年，有三個相互獨立的信號同時出現，把「迴圈」這件事推上了檯面。

信號一：Peter Steinberger 的那條貼文

OpenClaw 開源工具創辦人、現任職 OpenAI 的 Peter Steinberger 在 X 上寫了一句話：「你不應該再去提示你的程式碼代理了。你應該設計會去提示代理的迴圈。」這條貼文獲得了超過三百萬次觀看。

Here’s your monthly reminder that you shouldn’t be prompting coding agents anymore.

You should be designing loops that prompt your agents.
— Peter Steinberger 🦞 (@steipete) June 7, 2026

信號二：Karpathy 的 700 次實驗

前 OpenAI 研究員 Andrej Karpathy 用 630 行 Python，讓一群 AI Agent 連跑兩天，自己執行了 700 次實驗，發現 20 個有效優化，最終讓語言模型的訓練時間縮短了 11%——全程零人工介入。他把這套系統稱為「autoresearch」，並說：「所有頂尖 LLM 實驗室都會走上這條路，這是最終的 boss 戰。」

信號三：Boris Cherny 的那段採訪

Claude Code 的締造者在訪談中直白地說：他一天同時開著 5 到 10 個 session，夜間有幾千個 Agent 在背景跑。他的工作，已經從「寫好提示詞」升維成「設計讓 AI 自己工作的迴圈系統」。

三個不同背景、不同公司的人，在同一週指向同一件事。Addy Osmani 看到這個訊號，在 2026 年 6 月 7 日寫出了定義 Loop Engineering 的那篇文章，把散落的概念整合成了一套完整框架。

二、Loop Engineering 到底是什麼？白話定義

最精準的一句定義

Addy Osmani 給了一個清晰到無法再更精準的定義：

Loop Engineering，就是把「負責提示 AI 的你」這個角色，換成一套替你做這件事的系統。

意思是：你不再是那個一輪一輪對 AI 說「請幫我做這件事」的人。你設計一個小系統，讓這個系統自己去尋找工作、把工作交給 Agent、檢查結果、記下進度，然後決定下一步——你只設計這套系統一次，之後它就自己持續運轉。

跟傳統 Prompt Engineering 差在哪？

用一個對照來看：

	Prompt Engineering	Loop Engineering
核心工作	把指令寫清楚	設計回饋循環
人的角色	每一輪都要介入	只在起始與例外時介入
關鍵能力	語言精準度	系統設計能力
輸出特性	單次、手動觸發	持續、自動迭代
槓桿點	這一次的指令品質	整套系統的架構品質
驗證方式	人工閱讀輸出	自動化測試 + 子 Agent 審核

一句話濃縮：提示工程師說「幫我寫一個函式」；迴圈工程師說「寫出來、測試、修到全部通過為止」。

Prompt Engineering 沒有消失，它只是「降格」成了迴圈的一個元件——Loop 裡面仍然有 Prompt，只是你不再是那個每次手動按下送出鍵的人。

Loop 與「寫腳本自動化」有何本質不同？

很多人第一反應是：「這不就是 cron job 加 bash script 嗎？」不完全是。傳統自動化腳本是「把固定流程寫死」，Loop Engineering 的本質差異在於三個新能力：

能讀 Context：Agent 能理解當前狀況，而不是盲目執行預設指令。
會產生假設：Agent 能自己推理「下一步應該做什麼」。
從失敗中學習：當一個方法失敗時，Agent 能根據失敗原因調整策略再試。

這三件事，是 cron job + bash script 天生做不到的。

三、五個積木＋一個靈魂：Loop 的完整結構

Addy Osmani
Addy Osmani 把一個完整可運作的 Loop 拆成了五個積木加一個記憶層。缺任何一塊，Loop 就會從「自動工作的系統」退化成「燒錢的玩具」。

積木 ① Automations（自動化）：迴圈的心跳

Automations 是讓 Loop 成為「迴圈」而不是「跑一次就結束的腳本」的關鍵。你定義一個任務、一個執行頻率、一個目標條件，系統就照排程自己啟動——有發現才回報，沒有發現就自動封存，不打擾你。

在 Claude Code 裡，/loop 指令負責按週期重跑，/goal 則讓 Agent 持續工作直到你寫下的條件成真。你可以丟給它「test/auth 底下所有測試通過、且程式碼檢查乾淨」，然後走開。OpenAI Codex 有對應的 Automations Tab，同樣支援設定任務、頻率、環境，跑完的結果會進入 Triage 收件匣。

OpenAI 工程師真實使用場景：每日 Issue Triage（自動分類問題清單）、匯整 CI 失敗報告、寫 commit 摘要、追蹤上週新增的 bug。

💡 沒有 Automation，Loop 就只是一段你跑了一次的腳本。

積木 ② Worktrees（工作樹）：多 Agent 並行不打架

一旦同時讓多個 Agent 工作，就會遇到一個問題：兩個 Agent 同時修改同一份檔案，就像兩個工程師沒有溝通就改了同一行程式碼，最後誰的版本都不對。

Git worktree（Git 版本控制中的一種隔離工作目錄機制）解決了這個問題：給每個 Agent 一個獨立的工作目錄和分支，共用同一份專案歷史，讓不同 Agent 的修改彼此不干擾。

Claude Code 支援 --worktree 旗標，讓每個 session 在自己的 checkout 環境中執行；Codex 則直接把 worktree 支援建入多執行緒設計中。

💡 Worktrees 解決了「機械性衝突」，但你的審查頻寬，仍然是整個 Loop 能並行多少工作的真正上限。

積木 ③ Skills（技能）：知識寫一次，永遠複利

Agent 有一個根本的弱點：每次對話開始都是「冷啟動」。它不記得上次你告訴它「我們因為那次事故，所以不能這樣寫」，也不記得你的程式碼規範是什麼、建置步驟怎麼跑。

Skills 解決這個問題。一個 Skill 就是一個包含 SKILL.md 的資料夾——一份純文字檔，把你的專案慣例、架構決策、禁止做法、過去的「血淚教訓」全部寫進去。Agent 每次執行都會先讀這份文件，讓知識從「在你的腦袋裡」變成「在系統的輸入端」，持續複利累積。

沒有 Skills：每一個 Loop 循環都要重新摸索你的專案，等同於每次都從零開始。
有了 Skills：Agent 站在前一輪的肩膀上，直接繼承所有已知的專案脈絡。

💡 Addy Osmani 說：Skills 是「把意圖外部化」的機制——你的決策不再只存在於 Prompt 裡，而是永久寫在倉庫中，讓每一輪都更精準。

積木 ④ Plugins / Connectors（外掛與連接器）：讓 Loop 碰得到真實世界

一個只能看到本機檔案系統的 Loop，是一個極度受限的 Loop。Connectors 建立在 MCP（Model Context Protocol，Anthropic 推出的 AI 串接外部工具開放協定）之上，讓 Agent 能讀取你的 Issue Tracker、查詢資料庫、呼叫 Staging API、在 Slack 發送通知。

這是「告訴你怎麼修」和「自己開好 PR、連好 Linear 票、CI 一綠就通知頻道」的本質差距。

Claude Code 和 Codex 都支援 MCP，這意味著你為其中一個工具寫的 connector，通常可以直接用在另一個工具上。

💡 Connectors 讓 Loop 從「在沙盒裡空轉」升級成「真正改變外部世界狀態的系統」。

積木 ⑤ Sub-agents（子代理）：寫的人和查的人，永遠不能是同一個

這是整個 Loop 架構裡最關鍵、也最容易被忽略的設計原則。Addy Osmani 說：「寫程式的那個模型，對自己的作業太寬容了。」

讓一個 Agent 同時負責「生成輸出」和「審查輸出」，等同於讓同一個人既當球員又當裁判——它會說服自己輸出是對的，而看不見自己犯下的錯誤。Sub-agents 把「製造者」和「檢查者」強制拆開：一個 Agent 負責寫程式，另一個有不同指令（有時甚至是不同模型）的 Agent 負責審查，抓出第一個 Agent「自圓其說」後留下的問題。

Claude Code 的 /goal 指令，底層就是這個原理——一個全新的小模型負責判斷「這個 Loop 到底算不算完成了」，而不是讓做事的模型自己打分。

在 Claude Code 中，你可以在 .claude/agents/ 目錄定義子 Agent；Codex 則是用 .codex/agents/ 目錄的 TOML 設定檔。典型的分工是：探索 Agent → 實作 Agent → 驗證 Agent，三個角色分開，互不相見。

💡 Sub-agents 消耗更多 Token，因為每個子 Agent 都要做自己的推理和工具呼叫——所以要用在真正值得「第二意見」的地方。

＋1 記憶層 Memory（State）：Loop 的脊椎

這塊最容易被忽略，但它是整個系統的脊椎。

Agent 在對話結束後會忘記一切。如果沒有一個「活在對話之外」的記憶機制，每次 Loop 啟動都等於重新開機——不知道上次做到哪裡、哪些已完成、哪些待處理。

實作上可以非常簡單：一個 Markdown 檔案、一塊 Linear 看板、一個 AGENTS.md 進度日誌，任何能讓 Loop「明天的那一輪接著今天停下的地方繼續」的機制都行。

Addy Osmani 說了一句很傳神的話：

「Agent 會忘，但倉庫不會忘。」

四、一個完整 Loop 長什麼樣？

把五個積木拼起來，一個真實運作的 Loop 大概是這樣的形狀：

每天早上，Automation 自動啟動，呼叫一個 Triage Skill，掃描昨天的 CI 失敗、未解決的 Issue、最近的 commit，把發現寫入 Markdown 狀態檔或 Linear 看板。

針對每一個值得處理的發現，Loop 開一個隔離的 Worktree，派遣一個實作 Sub-agent 去草擬修正方案，再派一個審查 Sub-agent 對照專案 Skills 和現有測試評估品質。

如果通過審查，Connector 自動開好 PR、更新 Linear 票。如果沒通過，Loop 把問題記入狀態檔，等下一輪再試。Loop 無法處理的例外，會進入 Triage 收件匣，讓人類決定。

你設計這套系統一次。之後你不再手動輸入任何一個步驟的提示詞。

五、三個會讓 Loop 失控的大坑

Loop Engineering 不是「按下執行就高枕無憂」的魔法。Addy Osmani 明確指出了三個會讓系統從「槓桿工具」變成「慢性毒藥」的風險。

大坑 ① 沒設好 Stop Condition：帳單在你睡覺時爆掉

一個沒有明確停止條件的 Loop，就是一個持續燒錢的機器。

Anthropic 自己說，Agent 系統平均會消耗比一般對話多 4 倍的 Token；Multi-agent 系統甚至可以達到 15 倍。如果沒有設定明確的「達成條件」（例如：所有測試通過、lint 乾淨）、最大迭代次數、或 Token 預算上限，Loop 會在你不注意的時候一直跑、一直花錢。

解決方案：在設計任何 Loop 之前，先寫清楚三件事：成功長什麼樣、最多跑幾輪、花多少錢就停。/goal 指令的條件寫法是好的起手式，例如：all tests in test/auth pass and lint is clean，然後設定 Token 預算上限。

大坑 ② 理解債（Comprehension Debt）：你不懂的程式碼越堆越多

Loop 讓你可以一夜之間合併 10 個 PR，但你真的讀懂這 10 個 PR 改了什麼嗎？

Comprehension Debt（理解債）是指：你在倉庫裡的實際程式碼，和你真正理解的部分，之間的落差。Loop 讓這個落差快速擴大。六個月後，當 production 出了 bug，你站在自己的 codebase 前面，看著一堆沒人讀過的程式碼。真正會痛的不是 Token 帳單，而是那個瞬間。

解決方案：對重要的模組，不要讓 Loop 直接 merge。讀那些 diff。 每個被接受的修改，至少自己看過一遍，留下「為什麼這樣寫」的一兩句筆記。

大坑 ③ 認知投降（Cognitive Surrender）：最舒適的姿勢是最危險的

當 Loop 順暢地自動工作，你會開始不想思考了。

「系統給了什麼，我就接受什麼」——這就是認知投降。設計 Loop 的人，當他用判斷力來設計時，Loop 是倍增器；當他用 Loop 來逃避思考時，Loop 是加速器——加速走向失控。

Addy Osmani 說了一句讓人難忘的話：

「兩個人建出一模一樣的迴圈，可能得到完全相反的結果。一個用它在自己深刻理解的工作上跑得更快，另一個用它來逃避理解工作本身。迴圈分不出差別，你分得出。」

解決方案：定期問自己：「如果今天所有的 Loop 都停掉、所有的 Agent 都關閉，我還知道下一步要做什麼嗎？」如果答案模糊，你已經在認知投降的路上了。

六、我適合建 Loop 嗎？四個條件缺一不可

Loop Engineering 不是每個人、每個任務都適合的。Addy Osmani 和社群裡的多位工程師都強調：多數開發者現在還不需要 Loop。

以下四個條件要同時成立，建 Loop 才划算——缺任何一個，傳統 Prompt 更快更省：

條件	說明
1. 任務會重複發生	Loop 靠多次執行攤平設計成本。一次性工作，用好 Prompt 就夠了。
2. 驗證可以自動化	必須有一個「不需要你在場也能讓工作不及格」的機制：測試、型別檢查、linter。
3. Token 預算扛得住浪費	Loop 會反覆讀脈絡、重試、探索，不管有沒有輸出都在燒 Token。
4. Agent 有足夠的工具	它要能執行自己改的程式、看到哪裡壞掉、讀日誌。沒有這些，Loop 是盲目的。

最小可行 Loop（快速起手式）

如果你確認四個條件都符合，不要一開始就堆大系統。最小可行 Loop 只需要四個元件：

一個 Automation：有明確停止條件的排程觸發。
一個 SKILL.md：把 Agent 每次都要重新摸索的專案脈絡寫進去。
一個狀態檔：Markdown 或 Linear 看板，記下做了什麼、還剩什麼。
一道關卡（Gate）：能自動擋下爛輸出的測試或 lint 檢查。這一塊決定了 Loop 是在幫你，還是只在燒錢。

⚠️ 順序很重要：先讓「一次手動執行」穩定可靠，再把它變成 Skill，再包成 Loop，最後才排程。跳步驟，是 Loop 在正式環境翻車的主因。

七、不同角色的 Loop 應用場景

對工程師：自動優化研究迴圈

Karpathy 的 autoresearch 是最好的示範。一個能修改單一檔案的 Agent、一個客觀可量化的指標（例如：訓練時間、測試覆蓋率）、一個固定時長的實驗窗口，三個元件組合起來，就能在兩天內跑完 700 次實驗，找出 20 個優化方案。[9][11][28]

這種模式適用的場景：API 效能優化、程式碼靜態分析自動修正、每日 Issue Triage、CI 失敗自動分類等重複性高且可量化的任務。

對 PM / Agent 設計者：工作流編排

Boris Cherny 的模式更複雜：多個 Agent 並行運作，彼此透過 Worktrees 隔離、透過 State 共享進度。適合設計「Bug Triage → 自動草擬修補方案 → PR 審查 → 自動合併」這類跨越多個工具的長鏈工作流。

對內容創作者：一條文章自動拆成多格式

這是與 AI 新聞、SEO 內容工作最相關的應用。一個內容生產 Loop 的典型設計：

Automation：每天定時掃描 RSS 訂閱源、Google Trends、X 熱門詞
Skills：存入你的選題標準、寫作風格指南、SEO 規則、禁止措辭
執行：找出值得寫的主題 → 生成長文骨架 → 自動拆分為電子報、IG 貼文、短影音腳本
Sub-agent：SEO 檢查 Agent 審查標題、關鍵字密度、meta description
State：記錄哪些主題已寫過、哪些格式已發佈、各篇文章的表現數據
Connector：串接 Notion（草稿存放）、Buffer 或原生 API（排程發佈）

這套 Loop 建好一次，你的注意力就可以從「執行」移到「選題判斷」和「內容品質把關」。

八、Loop Engineering 的現在與未來

工具層已經準備好了

2026 年的 Loop Engineering 之所以能成為一個可實踐的方法論，很大程度是因為工具層的成熟：Claude Code 和 Codex 都已內建了完整的五個積木，你不再需要自己維護一堆 bash script。

積木	Claude Code	OpenAI Codex
Automations	`/loop`、`/goal`、cron 排程、GitHub Actions	Automations Tab：設定 prompt、頻率、環境；Triage 收件匣
Worktrees	`--worktree` 旗標、`isolation: worktree`	內建多執行緒 worktree
Skills	`SKILL.md` 格式（位於 `.claude/skills/`）	`SKILL.md` 格式（位於 `.codex/skills/`）
Connectors	MCP 伺服器＋外掛	MCP 伺服器＋外掛（跨工具相容）
Sub-agents	`.claude/agents/` 目錄中定義 Agent 團隊	`.codex/agents/` 目錄 TOML 設定檔
State/Memory	AGENTS.md、進度檔、Linear via MCP	Markdown 或 Linear via connector

Prompt Engineering 並沒有消失

需要釐清的是：Loop Engineering 不是 Prompt Engineering 的終結，而是一次升維。Prompt 從「你跟 AI 說話的語言」變成了「Loop 裡的一個組件」。

如果說過去的技能樹是「寫出好提示詞」，現在的技能樹是「設計一套讓 AI 自己走完工作流的系統」。

Boris Cherny 也說，這個轉換的窗口期可能只有「接下來幾個月到今年年底」。在那之後，這會成為預設的工作方式，而不是少數人的前沿實踐。

九、結語：設計迴圈，但不要停止當工程師

Addy Osmani 在原文的最後寫了一段話，是整個 Loop Engineering 概念最重要的警醒：

「建你的迴圈。但要像一個打算繼續當工程師的人那樣建，而不是只當那個按下執行鍵的人。」

Loop Engineering 不是「把工作丟給 AI、自己去睡覺」的躺平術。它是一個槓桿工具——當你用清醒的判斷力來設計迴圈，它讓你的工作效能倍增；當你用它來逃避思考，它只會更快地把錯誤放大。

Karpathy 的 700 次實驗、Boris Cherny 的千個並行 Agent、Addy Osmani 的五積木框架，指向的是同一個未來：工程師的核心價值，從「打字輸入指令」移向了「設計讓 AI 替你打字的系統」。

這個轉換正在發生，現在就是你決定要停留在舊層級、還是往上移一層的時刻。

參考資料：Addy Osmani《Loop Engineering》(2026.06.07) addyosmani.com；Boris Cherny，Anthropic Claude Code 負責人訪談；Andrej Karpathy autoresearch 專案；數位時代《迴圈工程(Loop Engineering)是什麼？》；The AI Corner, Kilo.ai, AlphaMatch.ai 等多個技術分析來源。

Loop Engineering 是什麼？從 Prompt Engineering 進化到 AI 迴圈工程