Gemini 3 Flash 發布!速度快 3 倍 + Pro 級推理,免費預設模型全球上線
Google 推出 Gemini 3 家族新成員 Gemini 3 Flash,以 Flash 級速度提供 Pro 級推理,成本僅前代 fraction,今日起成為 Gemini App 與 Search AI Mode 預設模型。
Google Cloud 宣布 Gemini 3 Flash 正式上線,這是 Gemini 3 系列的輕量版,專為速度與成本優化設計。推理速度比 Gemini 2 Flash 快 2 倍,成本低 30%,參數規模雖縮減,但多模態能力保留 90%。
Gemini 3 Flash 技術架構與性能定位
Gemini 3 Flash 保留 Gemini 3 Pro 的邊界推理與多模態能力,同時大幅優化延遲與資源消耗,平均 token 使用量比 Gemini 2.5 Pro 少 30%,速度提升 3 倍(Artificial Analysis 獨立基準)。
這模型動態調節思考量:面對複雜任務投入更多計算資源,日常互動則優先回應速度,推動質量、成本與速度的 Pareto 前沿前移。
定價 $0.50/1M 輸入 token、$3/1M 輸出 token(音頻 $1/1M),讓企業級推理成本降至前代 fraction,適合高頻互動應用如聊天代理、即時分析與回應式工具。

GPQA Diamond 90.4% + SWE-bench Verified 78%,多模態推理近人類水準
Gemini 3 Flash 在 GPQA Diamond 達 90.4%、Humanity’s Last Exam 33.7%(無工具)、MMMU Pro 81.2%,與更大邊界模型相當,顯著優於 Gemini 2.5 Pro。
SWE-bench Verified 78% 不僅優於 2.5 系列,還超越 Gemini 3 Pro,證明在代理編碼與生產就緒系統上的實戰能力。
Google 強調,這模型在視頻分析、數據提取與視覺問答表現強大,啟用更智能應用如遊戲內助理或 A/B 測試實驗。客戶反饋來自 JetBrains、Bridgewater Associates、Figma 等,他們用 Gemini 3 Flash 轉型業務,認可其推理速度與效率平衡。
Gemini App 與 Search AI Mode 預設 Flash
Gemini 3 Flash 成為 Gemini App 與 Search AI Mode 預設模型,全球用戶免費存取。應用包括分析短視頻給高爾夫揮桿計劃、猜測繪畫內容、音頻錄製識別知識空白並創建測驗、語音 dictation 幾分鐘建運作應用。
Search AI Mode 考慮查詢細微差別,提供視覺易消化回應,結合即時本地資訊與推薦,適合複雜目標如即興旅行規劃或教育概念學習。
Google 展示範例:近即時手勢追蹤拼圖遊戲 AI 協助、A/B 測試載入旋轉器設計、圖像標註轉互動體驗、單提示生成三變體設計。
Google Antigravity + Vertex AI 優先,代理工作流全面加速
開發者透過 Google AI Studio 中的 Gemini API、Google Antigravity(新代理開發平台)、Gemini CLI、Android Studio、Vertex AI 與 Gemini Enterprise 存取 Gemini 3 Flash。
Google 強調,這適合迭代開發,提供 Gemini 3 的 Pro 級編碼性能與低延遲平衡,支援高頻工作流程如快速推理與問題解決。企業版 Vertex AI 提供治理與安全控制,適合生產環境部署。
Gemini 3 Flash 讓 AI 從高階工具變日常生產力,Google 6.5 億月活躍用戶數據反饋加速迭代,這模型推動 AI 從實驗室走向大規模生產應用,企業客戶轉向 Gemini 3 Flash 的速度遠超預期。