【科技專題】AI 大神 Andrej Karpathy 發布 2025 LLM 年度回顧:RLVR、Vibe Coding 與「鋸齒狀」智力的崛起

近日,Karpathy 發布了《2025 LLM Year in Review》,總結了過去一年大型語言模型(LLM)領域發生的範式轉移。

【科技專題】AI 大神 Andrej Karpathy 發布 2025 LLM 年度回顧:RLVR、Vibe Coding 與「鋸齒狀」智力的崛起

誰是 Andrej Karpathy?

在人工智慧領域,很少有人的觀點能像 Andrej Karpathy 一樣引起廣泛關注。

作為 OpenAI 的創始成員之一,他曾協助構建了現代生成式 AI 的基礎;隨後擔任特斯拉(Tesla)AI 總監期間,他領導了自動駕駛視覺團隊,將深度學習應用於現實世界的大規模機器人系統。

如今,他投身於 AI 教育領域,創立了 Eureka Labs,致力於普及高品質教育。

Karpathy 不僅是頂尖的研究者,更是一位能夠將複雜技術概念轉化為大眾語言的優秀教育家,他提出的「軟體 2.0」概念重新定義了我們對程式開發的理解。

近日,Karpathy 發布了《2025 LLM Year in Review》,總結了過去一年大型語言模型(LLM)領域發生的範式轉移。

以下是他在這份報告中提出的六大核心觀察:


核心機制的轉變:來自可驗證獎勵的強化學習 (RLVR)

Karpathy 指出,2025 年 LLM 生產流程出現了重大變革。

過去的標準流程是:

1.預訓練 (Pretraining)
2.監督微調 (SFT)
3.人類回饋強化學習 (RLHF)

但在 2025 年,「來自可驗證獎勵的強化學習」(Reinforcement Learning from Verifiable Rewards, RLVR)成為了新的關鍵階段。

透過在數學或程式碼這類具有客觀、不可博弈(non-gameable)獎勵的環境中訓練,模型自發地發展出人類視為「推理」的策略。

它們學會將問題拆解,並反覆推敲以找出答案。

這與 DeepSeek R1 論文中的例子相呼應。

這一階段允許更長時間的最佳化,將算力轉移到了推理過程,OpenAI 的 o1 和 o3 模型正是此一趨勢的代表,人們可以直觀地感受到模型在「思考時間」上的差異。


幽靈與動物:鋸齒狀的智力 (Jagged Intelligence)

Karpathy 提出了一個生動的比喻:我們不是在「演化動物」,而是在「召喚幽靈」。

人類的智力是為了在叢林中生存而演化的,但 LLM 的神經網路是為了模仿文本、解決數學謎題而最佳化的。

這導致 AI 展現出一種「鋸齒狀」的能力特徵:它們可能同時是一個博學的天才,卻又像個困惑的小學生,容易被簡單的越獄攻擊欺騙。

這也導致了基準測試(Benchmarks)的崩壞,因為實驗室可以針對這些可驗證的測試集進行過度優化,導致測試分數失去參考價值。

人類智力:藍色,AI 智力:紅色 它提醒我們:人類智力也以自己的方式呈現鋸齒

Cursor 與 LLM 應用程式的新層次

2025 年也是應用層爆發的一年,特別是像 Cursor 這樣的工具崛起。

Karpathy 認為這揭示了「LLM 應用」的新層次:這些應用程式不僅僅是發送提示詞,它們負責「上下文工程(Context Engineering)」、編排多個 LLM 的調用,並提供特定領域的圖形介面(GUI)和「自治滑桿(autonomy slider)」。

未來的 LLM 應用將像是一個組織者,將模型訓練成特定領域的專業人士。

【Vibe Coding】Cursor 完整使用教學:2025 最新教學,10 分鐘做出一個 App
Cursor 是革命性的 AI 程式開發工具,讓新手也能在10分鐘內開發 App。透過自然語言對話即可生成程式碼,實現 Vibe Coding 體驗,大幅提升開發效率,是2025年程式設計師必學神器。

Claude Code:住在你電腦裡的 AI

Anthropic 推出的 Claude Code 展示了 AI Agent 的新形態——它直接運行在你的電腦上(localhost),而不是雲端容器中。

Karpathy 認為這是一個關鍵的區別,因為它允許 AI 存取使用者的本地環境、數據和設定。

這種互動範式讓 AI 不再只是一個網站,而是一個「住在你電腦裡的小精靈」。

【Vibe Coding】Claude Code 教學|怎麼用一句話串連資料庫、建立全端網站?
用一句話指令,Claude Code 幫我把前端網站升級成能連資料庫的全端應用,從安裝到部署一次教會你!

Vibe Coding:程式設計的民主化

「Vibe Coding」一詞在 2025 年成為主流。

這意味著 AI 的能力已經跨越了一個門檻,人們可以完全透過自然語言(英文)來構建複雜的程式,甚至「忘記程式碼的存在」。

這不僅讓普通人能寫程式,也讓專業人士能快速構建那些以前因成本過高而不會去寫的軟體。

Karpathy 自己就透過 Vibe Coding 用 Rust 語言寫了一個高效的 BPE 分詞器,儘管他並不精通 Rust。


6. LLM 的圖形介面 (GUI)

Karpathy 認為 LLM 是繼 1970、80 年代電腦之後的下一個主要運算範式。

目前的對話介面就像是 80 年代的命令行(Command Line),雖然對電腦來說文本是原生格式,但人類更喜歡視覺化的資訊。

Google 的 Gemini Nano banana 模型展示了未來的可能性:LLM 應該以圖像、圖表、投影片或動態介面來回應我們,而不僅僅是文字。

【省錢裝潢】別急著找設計師!教你用 Gemini 免費把 2D 平面圖變成 3D 裝潢圖
裝潢免花錢!教你用 Gemini 3.0 將 2D 平面圖秒轉 4K 3D 渲染,省下高額設計費,輕鬆預覽夢想家。

未來展望:潛力與挑戰

儘管 2025 年進展驚人,Karpathy 在總結中強調,我們目前甚至還沒有挖掘出 LLM 現有能力的 10%。

他認為我們正處於新運算時代的「1960 年代」,基礎設施和應用生態才剛剛起步。

在更廣泛的未來展望中,Karpathy 提出了以下幾點見解:

  • AGI 仍需十年: 儘管技術飛速發展,Karpathy 認為通用人工智慧(AGI)不會是一個突然發生的奇點,而是會融入未來十年的 GDP 增長中,成為我們日常生活的一部分。
  • 教育的革命: 離開 OpenAI 後,Karpathy 將重心轉向教育。他認為 AI 將成為強大的導師,能夠為全球每個人提供個人化、高品質的教育內容,這不僅是為了傳遞知識,更是為了賦能人類,突破個人的認知極限。
  • 人機協作而非取代: 他強調 AI 的目標應該是「賦能人類」而非「取代人類」。未來的 AI 應像鋼鐵人裝甲一樣增強人類的能力,透過「部分自治(Partial Autonomy)」的模式,讓人們在保持監督的同時大幅提升生產力。
  • 核心學科的重要性: 對於未來的學習者,Karpathy 建議專注於數學、物理和電腦科學。這些學科能塑造思維能力和解決問題的邏輯,這是面對快速變化的 AI 時代最核心的技能。
Karpathy 的觀點提醒我們,雖然我們正在見證一場技術革命,但這場革命的核心仍應是關於如何擴展人類的潛能與創造力。

Source

Read more

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

每次請 AI 寫網頁代碼,UI 的顏色和間距總是像「抽盲盒」一樣難以預測?其實,你只需要幫 AI 建立一份「專屬設計說明書」。這篇文章專為非程式背景的設計師與 PM 打造,將透過 3 個簡單步驟,教你如何利用 Cursor 的「Design System Skill 」,讓 AI 牢牢記住你的 Material Design 或 Figma 設計規範。告別反覆來回修改的痛點,新手也能讓 AI 一鍵產出完美對齊設計稿的網頁組件!

lock-1
Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google 旗下實驗性 AI 設計工具 Stitch 於 2026 年 3 月 18 日迎來史上最大規模更新,正式進化為「AI 原生設計畫布(AI-Native Canvas)」。這次更新不僅是功能擴充,更是對整個設計流程的重新定義。Google 將這套理念稱為「Vibe Design(氛圍設計)」,讓任何人不需手動繪製線框稿,只要用自然語言描述想法,就能生成高保真 UI 介面。

Claude Cowork Dispatch:AI 遠端協作新紀元,手機指令驅動桌機智慧工作流

Claude Cowork Dispatch:AI 遠端協作新紀元,手機指令驅動桌機智慧工作流

Anthropic 於 2026 年 3 月 18 日正式推出 Claude Cowork Dispatch,這項創新功能標誌著 AI 助手從單純的「對話工具」進化為能夠執行複雜任務的「遠端數位員工」。用戶現在只需透過手機發出指令,即可驅動在桌機上運行的 Claude AI 處理任務並回傳報表,無需時刻守在電腦前。這不僅是 Claude Cowork 生態系統的重大里程碑,更為知識工作者開啟了跨裝置、無縫協作的全新可能性。