NVIDIA 發布 Cosmos 3:全球首個開放式 Physical AI 全模態基礎模型

NVIDIA 在台北 GTC 暨 Computex 2026 大會上,正式發布 Cosmos 3——全球第一個完全開放的 Physical AI 全模態基礎模型(Omnimodel)。 這是機器人與自駕車領域的重大里程碑,單一模型即可同時處理視覺推理、世界生成與動作預測三大任務。

Share
NVIDIA 發布 Cosmos 3:全球首個開放式 Physical AI 全模態基礎模型

什麼是 Cosmos 3?

Cosmos 3 採用突破性的 Mixture-of-Transformers(MoT)架構,將推理型 Transformer 與生成型 Transformer 雙塔整合於同一系統。 它能原生輸入與輸出文字、圖像、影片、環境音效與動作指令,無需多個獨立模型串接,大幅降低開發複雜度。

NVIDIA 創辦人暨執行長黃仁勳表示:

「物理 AI 的大爆炸即將來臨。Cosmos 3 系列開放前沿全模態模型,讓開發者能打造真正能感知、推理、規劃並行動的機器人、自駕車與視覺 AI。」

三大模型規格

Cosmos 3 提供三種版本,滿足不同應用場景需求:

版本參數量適用場景
Cosmos 3 Nano80 億(8B)工作站邊緣部署,RTX PRO 6000 GPU
Cosmos 3 Super320 億(32B)資料中心大規模合成資料生成,Hopper/Blackwell GPU
Cosmos 3 Edge即將推出邊緣即時推論(Coming Soon)

跑贏全榜:多項 Physical AI 基準測試第一

Cosmos 3 在多項開放模型排行榜中拿下第一,涵蓋:

  • 世界生成準確度:Physics-IQ、PAI-Bench、R-Bench
  • 動作策略評估:RoboLab、RoboArena
  • 視覺推理理解:VANTAGE-Bench、TAR 排行榜
  • 影像轉影片生成:Artificial Analysis 開源模型排名第一

此外,Cosmos 3 能將 Physical AI 的訓練週期從數月縮短至數天


完全開源:模型、訓練腳本、資料集全公開

NVIDIA 採取罕見的完整開源策略,在 Hugging Face 和 GitHub 上同步釋出:

  • 模型權重(Model Weights)
  • 訓練與後訓練腳本(Post-Training Scripts)
  • 合成資料生成資料集(Synthetic Data Datasets)

開發者也可透過 NVIDIA NIM 微服務部署,或使用雲端合作夥伴 Microsoft Azure、CoreWeave、Nebius 存取。

Cosmos Coalition:開放世界模型聯盟成立

NVIDIA 同步宣布成立 Cosmos Coalition,聯合多家 AI 實驗室與機器人領導廠商共同推進開放世界模型生態系。 創始成員包括:

  • Agile RobotsBlack Forest LabsGeneralist
  • LTXRunwaySkild AI

已採用 Cosmos 平台的產業應用夥伴則包含 三星(Samsung)LG ElectronicsDoosan Robotics(斗山機器人) 與 理想汽車(Li Auto)


立即取得 Cosmos 3

Read more

在場的各位都是 ____,Anthropic 推出最強模型 Fable 5

在場的各位都是 ____,Anthropic 推出最強模型 Fable 5

上週是我目前 Computex 生涯裡最狼狽的一次。 GTC Taipei 的前一天我生病了,結束後帶著 39 度的高燒從台北開車回林口,那應該是我這輩子開過最危險的一段車,當時真的應該直接叫 Uber 去看醫生的。也因為這樣,我的 Computex 行程全都壓在下半場。但難得來了,我決定挑戰一個自己平常根本不會碰的主題:能源、電力、資料中心。 先打個預防針:我不是電力工程師,也不是金融分析師。我只是一個每天在用 AI、偶爾分享怎麼用 AI 的人。所以這篇文章不會有很深的技術分析,但我可以告訴你我「為什麼覺得這件事值得花一個下午去聽」。 我印象很深刻的是,前年年底 Satya Nadella 接受訪談時提到,他們手裡有一堆GPU,有 RAM,有一堆準備好的硬體,但問題是資料中心根本來不及蓋好,然後也沒有電,這些硬體就單純買來放在那邊,因為沒有任何地方可以插進去。 但你知道嗎,這件事過去了一年半了,事情並沒有解決。高盛在最近的報告裡更新了他們的預測:

lock-1