NVIDIA 發布 Cosmos 3:全球首個開放式 Physical AI 全模態基礎模型
NVIDIA 在台北 GTC 暨 Computex 2026 大會上,正式發布 Cosmos 3——全球第一個完全開放的 Physical AI 全模態基礎模型(Omnimodel)。 這是機器人與自駕車領域的重大里程碑,單一模型即可同時處理視覺推理、世界生成與動作預測三大任務。
什麼是 Cosmos 3?
Cosmos 3 採用突破性的 Mixture-of-Transformers(MoT)架構,將推理型 Transformer 與生成型 Transformer 雙塔整合於同一系統。 它能原生輸入與輸出文字、圖像、影片、環境音效與動作指令,無需多個獨立模型串接,大幅降低開發複雜度。
NVIDIA 創辦人暨執行長黃仁勳表示:
「物理 AI 的大爆炸即將來臨。Cosmos 3 系列開放前沿全模態模型,讓開發者能打造真正能感知、推理、規劃並行動的機器人、自駕車與視覺 AI。」
三大模型規格
Cosmos 3 提供三種版本,滿足不同應用場景需求:
| 版本 | 參數量 | 適用場景 |
|---|---|---|
| Cosmos 3 Nano | 80 億(8B) | 工作站邊緣部署,RTX PRO 6000 GPU |
| Cosmos 3 Super | 320 億(32B) | 資料中心大規模合成資料生成,Hopper/Blackwell GPU |
| Cosmos 3 Edge | 即將推出 | 邊緣即時推論(Coming Soon) |

跑贏全榜:多項 Physical AI 基準測試第一
Cosmos 3 在多項開放模型排行榜中拿下第一,涵蓋:
- 世界生成準確度:Physics-IQ、PAI-Bench、R-Bench
- 動作策略評估:RoboLab、RoboArena
- 視覺推理理解:VANTAGE-Bench、TAR 排行榜
- 影像轉影片生成:Artificial Analysis 開源模型排名第一
此外,Cosmos 3 能將 Physical AI 的訓練週期從數月縮短至數天。
完全開源:模型、訓練腳本、資料集全公開
NVIDIA 採取罕見的完整開源策略,在 Hugging Face 和 GitHub 上同步釋出:
- 模型權重(Model Weights)
- 訓練與後訓練腳本(Post-Training Scripts)
- 合成資料生成資料集(Synthetic Data Datasets)
開發者也可透過 NVIDIA NIM 微服務部署,或使用雲端合作夥伴 Microsoft Azure、CoreWeave、Nebius 存取。

Cosmos Coalition:開放世界模型聯盟成立
NVIDIA 同步宣布成立 Cosmos Coalition,聯合多家 AI 實驗室與機器人領導廠商共同推進開放世界模型生態系。 創始成員包括:
- Agile Robots、Black Forest Labs、Generalist
- LTX、Runway、Skild AI
已採用 Cosmos 平台的產業應用夥伴則包含 三星(Samsung)、LG Electronics、Doosan Robotics(斗山機器人) 與 理想汽車(Li Auto)。
立即取得 Cosmos 3
- 🤗 下載模型:Hugging Face
- ⚙️ 後訓練腳本:GitHub
- 🚀 雲端部署:NVIDIA Build