【科技專題】AI 大神 Andrej Karpathy 發布 2025 LLM 年度回顧:RLVR、Vibe Coding 與「鋸齒狀」智力的崛起

近日,Karpathy 發布了《2025 LLM Year in Review》,總結了過去一年大型語言模型(LLM)領域發生的範式轉移。

【科技專題】AI 大神 Andrej Karpathy 發布 2025 LLM 年度回顧:RLVR、Vibe Coding 與「鋸齒狀」智力的崛起

誰是 Andrej Karpathy?

在人工智慧領域,很少有人的觀點能像 Andrej Karpathy 一樣引起廣泛關注。

作為 OpenAI 的創始成員之一,他曾協助構建了現代生成式 AI 的基礎;隨後擔任特斯拉(Tesla)AI 總監期間,他領導了自動駕駛視覺團隊,將深度學習應用於現實世界的大規模機器人系統。

如今,他投身於 AI 教育領域,創立了 Eureka Labs,致力於普及高品質教育。

Karpathy 不僅是頂尖的研究者,更是一位能夠將複雜技術概念轉化為大眾語言的優秀教育家,他提出的「軟體 2.0」概念重新定義了我們對程式開發的理解。

近日,Karpathy 發布了《2025 LLM Year in Review》,總結了過去一年大型語言模型(LLM)領域發生的範式轉移。

以下是他在這份報告中提出的六大核心觀察:


核心機制的轉變:來自可驗證獎勵的強化學習 (RLVR)

Karpathy 指出,2025 年 LLM 生產流程出現了重大變革。

過去的標準流程是:

1.預訓練 (Pretraining)
2.監督微調 (SFT)
3.人類回饋強化學習 (RLHF)

但在 2025 年,「來自可驗證獎勵的強化學習」(Reinforcement Learning from Verifiable Rewards, RLVR)成為了新的關鍵階段。

透過在數學或程式碼這類具有客觀、不可博弈(non-gameable)獎勵的環境中訓練,模型自發地發展出人類視為「推理」的策略。

它們學會將問題拆解,並反覆推敲以找出答案。

這與 DeepSeek R1 論文中的例子相呼應。

這一階段允許更長時間的最佳化,將算力轉移到了推理過程,OpenAI 的 o1 和 o3 模型正是此一趨勢的代表,人們可以直觀地感受到模型在「思考時間」上的差異。


幽靈與動物:鋸齒狀的智力 (Jagged Intelligence)

Karpathy 提出了一個生動的比喻:我們不是在「演化動物」,而是在「召喚幽靈」。

人類的智力是為了在叢林中生存而演化的,但 LLM 的神經網路是為了模仿文本、解決數學謎題而最佳化的。

這導致 AI 展現出一種「鋸齒狀」的能力特徵:它們可能同時是一個博學的天才,卻又像個困惑的小學生,容易被簡單的越獄攻擊欺騙。

這也導致了基準測試(Benchmarks)的崩壞,因為實驗室可以針對這些可驗證的測試集進行過度優化,導致測試分數失去參考價值。

人類智力:藍色,AI 智力:紅色 它提醒我們:人類智力也以自己的方式呈現鋸齒

Cursor 與 LLM 應用程式的新層次

2025 年也是應用層爆發的一年,特別是像 Cursor 這樣的工具崛起。

Karpathy 認為這揭示了「LLM 應用」的新層次:這些應用程式不僅僅是發送提示詞,它們負責「上下文工程(Context Engineering)」、編排多個 LLM 的調用,並提供特定領域的圖形介面(GUI)和「自治滑桿(autonomy slider)」。

未來的 LLM 應用將像是一個組織者,將模型訓練成特定領域的專業人士。

【Vibe Coding】Cursor 完整使用教學:2025 最新教學,10 分鐘做出一個 App
Cursor 是革命性的 AI 程式開發工具,讓新手也能在10分鐘內開發 App。透過自然語言對話即可生成程式碼,實現 Vibe Coding 體驗,大幅提升開發效率,是2025年程式設計師必學神器。

Claude Code:住在你電腦裡的 AI

Anthropic 推出的 Claude Code 展示了 AI Agent 的新形態——它直接運行在你的電腦上(localhost),而不是雲端容器中。

Karpathy 認為這是一個關鍵的區別,因為它允許 AI 存取使用者的本地環境、數據和設定。

這種互動範式讓 AI 不再只是一個網站,而是一個「住在你電腦裡的小精靈」。

【Vibe Coding】Claude Code 教學|怎麼用一句話串連資料庫、建立全端網站?
用一句話指令,Claude Code 幫我把前端網站升級成能連資料庫的全端應用,從安裝到部署一次教會你!

Vibe Coding:程式設計的民主化

「Vibe Coding」一詞在 2025 年成為主流。

這意味著 AI 的能力已經跨越了一個門檻,人們可以完全透過自然語言(英文)來構建複雜的程式,甚至「忘記程式碼的存在」。

這不僅讓普通人能寫程式,也讓專業人士能快速構建那些以前因成本過高而不會去寫的軟體。

Karpathy 自己就透過 Vibe Coding 用 Rust 語言寫了一個高效的 BPE 分詞器,儘管他並不精通 Rust。


6. LLM 的圖形介面 (GUI)

Karpathy 認為 LLM 是繼 1970、80 年代電腦之後的下一個主要運算範式。

目前的對話介面就像是 80 年代的命令行(Command Line),雖然對電腦來說文本是原生格式,但人類更喜歡視覺化的資訊。

Google 的 Gemini Nano banana 模型展示了未來的可能性:LLM 應該以圖像、圖表、投影片或動態介面來回應我們,而不僅僅是文字。

【省錢裝潢】別急著找設計師!教你用 Gemini 免費把 2D 平面圖變成 3D 裝潢圖
裝潢免花錢!教你用 Gemini 3.0 將 2D 平面圖秒轉 4K 3D 渲染,省下高額設計費,輕鬆預覽夢想家。

未來展望:潛力與挑戰

儘管 2025 年進展驚人,Karpathy 在總結中強調,我們目前甚至還沒有挖掘出 LLM 現有能力的 10%。

他認為我們正處於新運算時代的「1960 年代」,基礎設施和應用生態才剛剛起步。

在更廣泛的未來展望中,Karpathy 提出了以下幾點見解:

  • AGI 仍需十年: 儘管技術飛速發展,Karpathy 認為通用人工智慧(AGI)不會是一個突然發生的奇點,而是會融入未來十年的 GDP 增長中,成為我們日常生活的一部分。
  • 教育的革命: 離開 OpenAI 後,Karpathy 將重心轉向教育。他認為 AI 將成為強大的導師,能夠為全球每個人提供個人化、高品質的教育內容,這不僅是為了傳遞知識,更是為了賦能人類,突破個人的認知極限。
  • 人機協作而非取代: 他強調 AI 的目標應該是「賦能人類」而非「取代人類」。未來的 AI 應像鋼鐵人裝甲一樣增強人類的能力,透過「部分自治(Partial Autonomy)」的模式,讓人們在保持監督的同時大幅提升生產力。
  • 核心學科的重要性: 對於未來的學習者,Karpathy 建議專注於數學、物理和電腦科學。這些學科能塑造思維能力和解決問題的邏輯,這是面對快速變化的 AI 時代最核心的技能。
Karpathy 的觀點提醒我們,雖然我們正在見證一場技術革命,但這場革命的核心仍應是關於如何擴展人類的潛能與創造力。

Source