【深度專題】NVIDIA 讓機器人「夢中練功」:AI 怎麼讓它無師自通?

機器人真的能靠「做夢」學習和訓練嗎? NVIDIA 研究團隊提出新技術 DreamGen,讓機器人光靠看影片、做夢,就能學會全新的任務動作。

【深度專題】NVIDIA 讓機器人「夢中練功」:AI 怎麼讓它無師自通?

機器人能「做夢」訓練技能?AI 教學邏輯的轉變

一台人形機器人站在桌前,沒有任何人控制,卻能優雅地完成「澆花」、「燙衣服」、「開筆電」等完全不同類型的任務。

它怎麼做到的?

不同於傳統機器人學習人類「操作示範」,也不是靠模擬器裡種種的錯誤中學習,而是「做夢」。更準確地說,是 AI 利用影片生成模型,在腦中「預演」自己完成任務的過程,並從這些想像中推論出如何在現實中行動。

這是 DreamGen

0:00
/0:39

DreamGen:不再模仿學習,AI 靠「想像力」也能學會行動

長久以來,機器人的學習基本上都遵循著「模仿學習」。人操作一次,機器人錄下來、一遍又一遍,重複練習訓練直到能執行。這個方式直觀好理解,但仰賴人力、不夠靈活,當任務一改、場景一變,就得重來,耗時也吃力。

DreamGen 改變了這個邏輯。它提出一個新假設:與其照著人類示範模仿,不如讓機器人「自己想像」要怎麼做。

它只需要一個簡單任務的操作示範,比如「把杯子撿起來放到桌上」,就能透過影片生成模型,幫機器人「幻想」出各種任務情境的變化版本。不同環境、不同角度、不同物件,AI 都能在腦中模擬一遍,並推理出:該怎麼做、什麼時機做、怎麼做得剛剛好。

這些幻想出來的影片,叫做 neural trajectories(神經軌跡)。它們就像機器人在腦中排演過的任務藍圖,而 DreamGen 的技術流程,就是要把這些「腦中劇本」變成真實世界中可執行的動作策略。

0:00
/0:13

現在你也可以線上親自體驗 DreamGen 的 demo,上傳輸入影像,寫下Prompt,看看 AI 怎麼靠「幻想影片」學會動作: https://dreamgen-u8q2hhdcu.brevlab.com

不只是訓練能力,也是訓練「想像力」

想像你是一位料理新手,只學過一次煎荷包蛋。傳統的做法是你得自己煎上十幾次,從錯誤中找到節奏與火候。

但如果你看了各種料理影片,腦中開始預演不同瓦斯爐、不同鍋子、不同食材的變化,你會發現,你已經默默在腦中練習過幾十次。等你實際動手,成功率也高了許多。

DreamGen 就是像這樣,它幫機器人建立一套「腦中模擬機制」。整個流程包含四個步驟:

  1. 學會動態結構:先微調影片世界模型,讓它理解機器人自己的肢體構造與運動邏輯。
  2. 生成影片:輸入一張畫面加上一句文字指令(例如:「把水倒進杯子」),就能生成完整的任務影片。
  3. 推論出行動:再透過逆向動力模型(Inverse Dynamics Model, IDM),從影片中推理出每一步的動作序列。
  4. 訓練控制策略:最後,將這些影片與動作對應起來,餵給下游模型學習,讓機器人能實際執行。

重點在於:你不需要示範一百次,只需要給一個起點,剩下的由 AI 自己腦補。

白話一點,DreamGen 給了機器人舉一反三、甚至反百的能力。

機器人不只是會幻想,它還能做出來

DreamGen 讓人驚豔的,不只是「會想像」,而是這些「想像出來的動作流程」,竟然真的能應用在現實世界中。

研究團隊只給機器人看過「撿東西放桌上」這一種任務,但在 DreamGen 的幫助下,它居然能執行完全沒見過的新任務,比如「澆花」、「打開微波爐」、「掀開鍋蓋」等等。這在 AI 領域被稱作零樣本泛化(Zero-Shot Generalization),也就是「從未訓練過,也能執行」。

而且 DreamGen 不只泛化任務,還能跨平台跨設備應用。不論是高階機械手臂 Franka,還是平價版本的 SO-100,甚至不同視角(像是手腕視角、俯視鏡頭)都能對應處理。

它學到的不是某個動作,而是如何學會新的動作方式本身

機器人不只是技能轉移,也讓機器人學會「如何學習」。

DreamGen:改寫「誰教誰」的學習邏輯

過去我們對 AI 能力的評估,通常跟資料量成正比:資料越多、模型越強。但 DreamGen 換了一種觀點:不是資料多才重要,而是資料生成得夠好更重要。

在現有方法中,即使是像 Vision-Language-Action 這類機器人基礎模型(robot foundation models),也都得靠人類用遠端操控示範,才能累積足夠訓練資料。這表示再怎麼強的模型,也受限於人類一天 24 小時的上限。

DreamGen 打破這個限制。它讓學習的瓶頸,從「人力供應」轉向「算力擴充」。你不再需要一群工程師日以繼夜示範任務,而是讓幾百張 GPU 一起幫機器人「做夢練功」。

這種邏輯的改變,就像人類學習的演進歷程:我們從親身經歷,轉向靠書本、電影、模擬器來建構認知世界。DreamGen 讓機器人也踏上了這條路。

它不只有訓練動作,也在訓練「理解行為的能力」。

下一波機器人新世代,或許從這場夢開始

我們看著語言模型、影像生成、影片推理的 AI 一路演進,到今日實現機器人也能自我學習。

DreamGen 並非完美技術,但它代表了一個方向:AI 不只是聽從指令的工具,也是主動學習的參與者。是一種機器學習哲學的突破。

想像未來的某天,你剛搬進新家,對機器人說:「幫我收一下廚房。」它只需要看一張照片,自己在腦中「做夢」一輪,就知道該從哪開始、怎麼分類、哪裡該打掃。

而那場夢,或許就從 DreamGen 開始。

source: NVIDIA Research, DreamGen

Read more

Clawdbot 爆紅:一個月 10 美金,打造「你真正的個人 AI 員工」

Clawdbot 爆紅:一個月 10 美金,打造「你真正的個人 AI 員工」

嗨大家,你也有看 Alex Honnold 爬台北 101 的影片嗎?除了對那種超越人類體能極限的攀爬感到讚嘆外,特別吸引我注意的是 Alex 在攀爬過程中,玻璃窗內閃過的那些贊助廣告,我覺得超好笑 XDD。 對於台灣來說,這絕對是 2026 年最指標性的國際宣傳,甚至可以說是台北在全球視野中一次極其成功的「品牌曝光」。 我也因為好奇「這件事到底是怎麼發生的?」去查了一下背景。原來 Alex 早在多年前就盯上了這座曾是世界第一的摩天大樓,直到去年,他主動寫信給 101 的董事長賈永婕。這封信成了整件事的起點,也讓我們看到「爬 101」這件事情,一路下來有多困難,同時,這也是台灣少見的國際級宣傳事件。 而這種「勇於挑戰、突破框架」的精神,其實跟我們接下來要分享的另一個體育(腦袋風暴)盛事不謀而合。 沒錯,今年的 Red Bull Basement

聯強國際攜手 AI 郵報發布「AI 生存法則」:中小企業轉型的最後一哩路,關鍵在於與「數位素養」與「規格驅動」

聯強國際攜手 AI 郵報發布「AI 生存法則」:中小企業轉型的最後一哩路,關鍵在於與「數位素養」與「規格驅動」

聯強國際攜手 AI 郵報舉辦「AI 生存法則」論壇,直擊中小企業 AI 轉型痛點。聯強副總 Jerry 指出,轉型關鍵不在算力,而在於員工能否將 Domain Knowledge 翻譯成 AI 語言的「數位素養」。技術專家 Will 保哥則提出「規格驅動開發」,強調透過精準描述上下文,以 20% 的規格投入換取 80% 的產出。本文深入分析企業如何從數據治理走向人機協作,跨越 AI 落地應用的最後一哩路。

Anthropic 推出 Claude in Excel:AI 正式進軍 Excel,一鍵生成圖表、公式、數據分析

Anthropic 推出 Claude in Excel:AI 正式進軍 Excel,一鍵生成圖表、公式、數據分析

Anthropic 在 2026 年 1 月 23 日正式向所有 Claude Pro 訂閱用戶推出 Claude in Excel 功能。這是一個革命性的 Excel 側邊欄附加元件,讓使用者可以直接在 Excel 中使用 Claude AI 進行數據分析、生成圖表、建立公式,甚至完整編輯試算表。這次更新不僅解放了專業人士的生產力,也引發了「傳統 Excel 技能是否會過時」的熱烈討論。