GPT-5.2 模型全解析:專為上班族升級的 AI 生產力,辦公能力大幅變強,成人模式明年登場

GPT-5.2 主打上班族生產力,長文、試算表與寫程式全面升級,成人模式預計 2026 登場。

GPT-5.2 模型全解析:專為上班族升級的 AI 生產力,辦公能力大幅變強,成人模式明年登場

OpenAI 於 12 月 11 日推出 GPT-5.2,將其定位為「迄今最強大的專業知識工作模型系列」,聚焦在試算表、簡報、程式開發、長文理解、視覺解讀多步驟任務執行等場景,目標是讓模型不只回答問題,而能像專業員工一樣交付可用成果。


這次更新的核心:為 Knowledge Work 而生

OpenAI 在官方說明中強調,GPT-5.2 的優先目標是「可帶來經濟價值的專業任務」。在 GDPval(涵蓋 44 種職業、以交付成果為導向的知識工作基準)上,GPT-5.2 Thinking 取得 70.9%,官方並指出其在多數高難度任務中已達到「專家級」表現。

在效率與成本方面,OpenAI 在官方文章中表示:GPT-5.2 Thinking 在 GDPval 的完成速度約為專業人士的 3 倍、成本約為 1%
部分外媒報導以更高的倍數描述體感效率,但這並非官方在該段落採用的數字口徑。)


三個版本一次到位:Instant / Thinking / Pro

GPT-5.2 系列在 ChatGPT 與 API 同步推進:

  • GPT-5.2 Instant:偏日常高效、查詢與寫作/翻譯等任務。
  • GPT-5.2 Thinking:面向深度推理與複雜專案,強調結構化輸出與端到端完成能力。
  • GPT-5.2 Pro:更高上限與更低重大錯誤率,適合高難度問題與更高品質要求。

五大升級亮點:從「會做」到「做得像專業交付」

1) 試算表與商務產出:更像「能直接交差」的成果

官方提到 GPT-5.2 Thinking 在試算表格式化、財務建模、簡報製作等任務有明顯進步;在「投行等級」的內部試算表建模任務(如財務三表、LBO 模型)上,Thinking 分數達 68.4%(相較 GPT-5.1 Thinking 的 59.1%)。

提示詞:建立一個人力資源方案模型,納入人員編制、招聘方案、流失率與預算影響。要涵蓋工程、行銷、法務與銷售部門。

2) 程式能力:SWE-Bench Pro 與 Verified 再刷新

GPT-5.2 Thinking 在 SWE-Bench Pro 取得 55.6%,在 SWE-bench Verified80.0%。官方也特別點名其前端與「含 3D 元素的 UI」生成能力提升,並展示單一提示詞生成完整單頁應用的案例(如海浪模擬、節日卡片、打字雨遊戲)。

3) 長文理解:256k Token + MRCRv2 逼近滿分

GPT-5.2 Thinking 在長上下文推理上主打「跨數十萬 token 的整合能力」,並指出其在 4-needle MRCR 測試(上下文可達 256k)接近 100% 準確度,用於合約、報告、研究論文、多檔案專案等深度文件分析。

4) 視覺理解:讀圖表、看介面、解釋科學圖表

官方基準中包含多個視覺推理與螢幕理解項目(例如 CharXiv、Screenspot Pro 等),顯示 GPT-5.2 在圖表理解、介面解讀與視覺推理上持續擴張可用性。

5) 工具呼叫與多步驟任務:從「回答」走向「執行」

GPT-5.2 在工具使用相關評測(如 Tau2-bench Telecom)列出高分,官方也將 GPT-5.2 形容為更適合「長時間運行的代理」與多工具協作。


更低幻覺與更強安全:以及「成人模式」時間表浮現

在「事實準確度」上,OpenAI 表示 GPT-5.2 Thinking 在一組去識別化的 ChatGPT 查詢中,「含錯誤的回覆」相對下降 38%(在啟用搜尋等條件下),但也提醒關鍵事項仍需查核。

安全性方面,官方強調在心理健康、自殘、情緒依賴等敏感對話的表現提升,並且開始有限度推出年齡預測模型,對未滿 18 歲使用者自動套用內容保護措施。

同時,多家外媒指出 OpenAI 也在簡報中提到:ChatGPT 的「Adult Mode(成人模式)」預計在 2026 年第一季推出,但上線節奏將取決於年齡預測/驗證機制的成熟度。

The Verge

上線與定價:ChatGPT 先付費用戶,API 全面供應

  • ChatGPT:GPT-5.2 Instant / Thinking / Pro 逐步推送,先面向 Plus、Pro、Business、Enterprise;GPT-5.1 將在 ChatGPT 保留一段時間後下線。
  • API(Responses API)
    • gpt-5.2(Thinking)、gpt-5.2-chat-latest(Instant)、gpt-5.2-pro(Pro)
    • 價格(每百萬 token):輸入 $1.75 / 輸出 $14;快取輸入 90% 折扣。Pro 為 輸入 $21 / 輸出 $168

Source