NVIDIA Vera Rubin 正式全面量產!黃仁勳 GTC Taipei 宣告「代理式 AI 工廠」時代來臨
NVIDIA 執行長黃仁勳今(1)日在台北流行音樂中心舉行的 GTC Taipei 2026 開幕主題演講中,正式宣告旗艦新世代平台 Vera Rubin 已全面投入量產(in full production),並稱這是「台灣有史以來規模最大的產品發表」。 黃仁勳同時宣布,AI 已不再只是成本,而是真正的「獲利引擎與 GDP 生成器」,正式啟動代理式 AI 工廠時代。
什麼是 Vera Rubin 平台?
Vera Rubin 並非單一晶片,而是 NVIDIA 史上最雄心勃勃的整合式機架級 AI 超級電腦系統,完整由七顆自研晶片構成五種機架級電腦,最終整合為一座可對外出售、部署與實際運作的 AI 超算系統。

從 2016 年第一台 DGX-1 到今天的 Vera Rubin NVL72,AI 算力在 10 年之間成長了 4,000 萬倍。」— Jensen Huang, GTC 2026
如果說 2016 年的 DGX-1 是一輛腳踏車,今天的 Vera Rubin NVL72 就是一架太空梭。
Vera Rubin Superchip:平台的核心引擎
Vera Rubin Superchip 將一顆 Vera CPU 與兩顆 Rubin GPU(搭載 HBM4 記憶體)整合於單一基板,是整套平台的運算核心。 Rubin GPU 採用台積電 3 奈米製程,每顆晶片包含 3,360 億個電晶體(雙光罩晶粒設計),每顆 GPU 配備 288 GB HBM4 記憶體。
Vera CPU 是全球資料中心中唯一使用 LPDDR5X 記憶體的處理器——這種原本用於手機和筆電的低功耗記憶體,被 NVIDIA 引入伺服器,目的是追求極致的單執行緒效能與能源效率,專為 AI Agent 高頻率工具呼叫而最佳化。

Vera Rubin NVL72:旗艦機型完整規格
旗艦機型 Vera Rubin NVL72 將 36 顆 Vera CPU 與 72 顆 Rubin GPU 整合於一組五機架系統中,透過第六代 NVLink(NVLink 6,每 GPU 3.6 TB/s 互連頻寬)作為單一運算域協同運作:
| 規格項目 | 數值 |
|---|---|
| GPU 數量 | 72 顆 Rubin GPU |
| CPU 數量 | 36 顆 Vera CPU |
| AI 算力(NVFP4) | 3.6 ExaFLOPS |
| 記憶體總容量 | 75 TB HBM4 |
| 記憶體頻寬 | 1.4 PB/s |
| 推論效能 vs 上代 | 提升 10 倍 |
| 每 Token 成本 vs 上代 | 降低 10 倍 |
| 兆參數吞吐量(搭配 Groq 3 LPX) | 提升最高 35 倍 |
| 電晶體總數(整套平台) | 6 兆個 |
| 冷卻方式 | 全液冷(45°C 熱水冷卻) |
| 機架安裝時間 | 縮短至 5 分鐘 |
整套系統 100% 液冷,採用 45°C 熱水冷卻搭配無纜線模組化設計,機架組裝時間從 Grace Blackwell 時代的兩小時大幅縮短至 5 分鐘,達到每週數千套系統的量產速度,每月可交付數個 Gigawatt 等級的 AI 工廠。

Groq 3 LPX:突破 Token 瓶頸的關鍵搭檔
NVIDIA 在 2025 年聖誕夜完成約 200 億美元收購 Groq 核心團隊後,首款整合產品 Groq 3 LPX(晶片代號 LP30)正式亮相。 一個 Groq 3 LPX 機架可裝載 256 顆 LPU,設計上擺在 Vera Rubin 機架旁邊運作,形成「異質解耦推論」架構:
- Groq 3 LPX 負責儲存兆級參數模型,擅長高吞吐低延遲的 prefill 階段
- Vera Rubin NVL72 負責處理大量 KV 快取,兩者透過乙太網路緊密耦合
- 黃仁勳建議配比:75% Vera Rubin + 25% Groq,主要用於程式碼生成等高價值 token 工作負載
由三星製造的 Groq LP30 晶片預計於 2026 年第三季開始出貨,搭配 Vera Rubin 一起部署。

Spectrum-X 乙太網路光學:AI 工廠的神經系統
Vera Rubin 平台同步推出全球首款整合共封裝光學(CPO)的 200 Gb/s SerDes 乙太網路交換器 Spectrum-X Ethernet Photonics,以整合矽光子取代傳統可插拔光纖模組:
- 每埠功耗降低約 5 倍
- 支援百萬 GPU 等級 AI 工廠的擴展需求
- 首批採用夥伴:CoreWeave、Lambda、Oracle Cloud Infrastructure
這項技術被黃仁勳定義為 AI 工廠「神經系統」的核心升級,讓數據中心內百萬 GPU 之間的通訊效率達到全新境界。

台灣:全球 AI 供應鏈的心臟
黃仁勳在演講中多次感謝台灣供應鏈,強調台灣擁有「全球最佳的供應鏈生態系」。Vera Rubin 整體供應鏈規模是前一代 Grace Blackwell 的兩倍,横跨 30 個國家、超過 350 家工廠,而光在台灣就有 150 家生態系夥伴共同參與生產。
台灣主要參與廠商包含:
- 鴻海(Hon Hai):Vera Rubin NVL72 整機櫃方案,具備 L11 機櫃整合到 L12 整機櫃一條龍能力,全球正打造超過 1 GW AI 基礎建設
- ASUS(華碩):液冷 AI 基礎設施整合方案
- Supermicro:Vera Rubin NVL72、HGX Rubin NVL8 及 Vera CPU 系統
黃仁勳動情說道:「台灣從一開始就和我們在一起,謝謝你台灣。」
Dell 完成全球首台 Vera Rubin 交付
Dell Technologies 執行長 Michael Dell 於演講期間在社群媒體公開展示影像,宣布 Dell 已完成全球第一台 Vera Rubin NVL72 機架交付,客戶為雲端運算商 CoreWeave,機型為液冷款 Dell PowerEdge XE9812。 正式量產出貨預計於 2026 年秋季全面啟動,微軟 Azure 亦已成功部署首個 Vera Rubin 機架。

DS X AI 工廠平台:「運算即營收」的商業新邏輯
黃仁勳在 GTC Taipei 提出核心論點:「Compute is revenue(運算即營收)」。 NVIDIA 同步發布 DS X 平台(DSX OS + DSX MaxLPS 軟體),統一 AI 工廠的設計、模擬、建構與運營,讓基礎設施業者可透過最低 Token 成本、最高每瓦吞吐量,將算力直接轉換為商業收益。
「如果你有 1 Gigawatt 的電力,那麼每瓦的吞吐量就是你的營收。」— Jensen Huang
未來路線圖:Rubin Ultra → Feynman → Rosa
NVIDIA 同步公開了清晰的多年技術路線圖:
| 世代 | 預計時程 | 主要特色 |
|---|---|---|
| Vera Rubin | 2026 下半年量產 | NVL72、Groq LP30、NVLink 6 |
| Rubin Ultra | 2027 年 | NVL144(Kyber 架構)、Groq LP35、NVFP4 支援 |
| Feynman | 2028 年 | 裸晶 GPU 設計、HBM 客製化、Groq LP40、新 CPU「Rosa」、BlueField-5 |
Feynman 世代將首次在裸晶(Die)上採用異質整合設計,並透過 NVLink 8 與 Spectrum-204 網路晶片將共封裝光學(CPO)推進至下一個層級,預計支援 NVL1152 規模的超大模型擴展架構。