DeepSeek V4 預覽版開源上線:百萬 Token 上下文、MIT 授權開放下載使用

DeepSeek 於 2026 年 4 月發布 V4 預覽版,Pro 與 Flash 兩款 MoE 模型均支援百萬 Token 上下文,MIT 授權完全開放下載。定價遠低於 OpenAI 與 Anthropic,對開源 AI 生態與業界競爭格局帶來新一輪衝擊。

Share
DeepSeek V4 預覽版開源上線:百萬 Token 上下文、MIT 授權開放下載使用

中國 AI 新創 DeepSeek 於 2026 年 4 月 24 日發布 DeepSeek-V4 Preview,延續開放權重策略,推出 V4-Pro 與 V4-Flash 兩個 MoE 模型版本,並支援最高 100 萬 tokens 上下文。官方已開放 Hugging Face 權重下載,採 MIT 授權;使用者也可透過 chat.deepseek.com 試用,或透過 DeepSeek API 呼叫新模型。需要留意的是,這次發布仍是預覽版(Preview),並非最終穩定版本。


DeepSeek V4 是什麼

DeepSeek V4 是 DeepSeek 繼 2025 年 R1 大爆發後推出的最新旗艦模型系列,分為兩個版本:V4-Pro(1.6 兆參數)與 V4-Flash(2840 億參數)。兩者均採用混合專家架構(MoE),每次推理只會啟動部分參數,在效能與成本之間取得平衡。

V4 系列的核心升級聚焦在三個方向:超長上下文、代理任務能力、以及推理效率。Pro 版本原生支援 100 萬 token 的上下文視窗,換算成中文約等於 60–70 萬字,可以一次性讀入整個程式碼庫或多份長篇報告再進行分析。相較之下,前一代 DeepSeek V3 的上下文上限僅有 12.8 萬 token。

根據 DeepSeek 自家技術報告,V4 在代理型任務與程式碼編寫方面的表現已超越所有現有開源模型,且在部分數學推理基準上接近 GPT-5.4 與 Claude Opus 4.6 的水準,但整體上仍落後頂尖閉源模型約三到六個月。這些數據為官方提供,尚未經過完全獨立的第三方驗證。

DeepSeek V4 規格比較

Image Credits: DeepSeek


如何使用 DeepSeek V4

DeepSeek V4 的模型權重採用 MIT 授權釋出,這是目前最寬鬆的開源授權之一,允許任何人免費下載、修改、商業使用,不需要支付任何費用或簽署特殊協議。API 呼叫則是付費計價服務,但定價遠低於主要閉源競品。

目前主要有三種使用方式:

1. 官方網頁介面(零門檻)
直接前往 chat.deepseek.com,不需要安裝任何軟體,即可免費與 V4 對話。適合想快速體驗的一般用戶。

2. Hugging Face 下載開放權重(進階用戶/伺服器環境)
Hugging Face 的 DeepSeek 頁面下載模型權重,資料完全不離開自有環境。需要留意的是,V4-Pro 參數量高達 1.6 兆,需要配備足夠 GPU 資源的伺服器或專業硬體才能順暢運行;V4-Flash 硬體需求相對較低,但對一般消費級筆電仍是挑戰。這條路徑適合具備 GPU 資源的進階用戶或企業自建環境。

3. DeepSeek API(開發者)
透過 DeepSeek API 直接呼叫 V4,按量計費。已有 OpenRouter API Key 的用戶,也可透過 OpenRouter 統一管理,不需要另外申請帳號。


為什麼這次定價讓業界緊張

DeepSeek V4 的定價策略是這次發布最受關注的部分。根據 DeepSeek 官方 API 文件,V4-Flash 輸出價格為每百萬 tokens $0.28;V4-Pro 輸出定價為每百萬 tokens $3.48。若以 OpenAI GPT-5.5 每百萬輸出 tokens $30 計算,V4-Pro 約為 GPT-5.5 的 1/8.6,V4-Flash 更僅為 1/107。

Fortune 報導指出,這樣的定價策略與目前整體 AI 市場的漲價趨勢背道而馳。就在同一週,OpenAI 也推出了 GPT-5.5,兩家同日發布的舉動明顯是刻意錯開新聞週期、搶佔市場心佔率。

DeepSeek 表示,隨著華為昇騰 950 芯片的量產規模擴大,V4-Pro 的 API 價格預計在今年稍晚進一步下調,成本還有繼續壓縮的空間。

模型 授權 上下文上限 API 輸出定價(/百萬 tokens)
DeepSeek V4-Pro MIT 開源 100 萬 tokens $3.48
DeepSeek V4-Flash MIT 開源 100 萬 tokens $0.28
OpenAI GPT-5.5 閉源 依官方模型頁與使用模式而異 $30
Anthropic Claude Opus 4.6 閉源 200K tokens $25

DeepSeek V4 vs R1:這次夠不夠震撼

BloombergMIT Technology Review 均指出,V4 的市場衝擊不太可能複製 R1 當年的震盪效果,因為投資人已經充分消化了「中國 AI 具有競爭力且更便宜」這個現實。

但 Counterpoint Research 分析師 Wei Sun 認為,V4 能在以華為昇騰芯片為主的中國國產硬體上原生運行,長遠意義可能超越 R1。這代表中國在 AI 基礎設施上已具備建立完整平行生態的能力,不再完全依賴被出口管制限制的 Nvidia GPU。

就產品層面而言,V4 是 DeepSeek 針對「長文件處理」與「自主代理任務」明顯提升的一代,對於需要讀入大量資料再推理分析的使用場景,是目前開源模型中最強的選項之一。目前站內已有類似定位的阿里 Qwen 3.6 Plus 免費模型介紹,兩者可以互相比較使用場景。


想每週掌握最新 AI 工具與趨勢?訂閱 AI 郵報,每週精選重點直送信箱,讓你不錯過任何重要動態。


資料來源

Read more