GPT-5.2 匆忙上線：OpenAI 在急什麼？聖誕更新可能才是重頭戲

Hank

16 Dec 2025 — 16 min read

每當我們提到「AI 工具變得越來越強」，其實是指它們在解決問題的方式上變得更加高效和靈活。從 Manus 1.6 MAX 模式的自動化流程，到 OpenAI 與迪士尼的十億合作，再 ChatGPT 引入 Claude Skills 功能——這些改變不只代表技術的進步，更是 AI 實際應用的拓展，從單純的工具升級為能夠主動執行任務的夥伴。

這週廢話不多說，馬上讓我們進入本週的五件 AI 大事，搭配一段觀察筆記
讓你不只是看熱鬧，也能看懂門道。

本周焦點事件

GPT-5.2 匆忙上線：OpenAI 在急什麼？聖誕更新可能才是重頭戲
自動化最強的 AI Agent ─ Manus AI 推出 1.6 MAX，三大升級一次看
迪士尼投資 OpenAI 10 億美元，Sora 將可生成超過 200 個經典角色
FAANG 工程師實測：AI Coding 不是玩票，讓上線速度加快 30%
OpenAI 也上車 Skills：ChatGPT × Codex CLI 實驗性支援上線

🎄AI 郵報聖誕精選｜你一定不能錯過的 AI 活動

今年 Microsoft Ignite 聚焦的「Work IQ／Fabric IQ／Foundry IQ」三大框架，正在改寫企業導入 AI 的路徑——從工作記憶到資料語意、再到 Agent 能力的落地，每一步都超關鍵，但該怎麼開始？

👉 台灣微軟將在 12/23（三創 Unispace） 舉辦一場實體活動，手把手帶你看懂這套 AI 能力藍圖怎麼落地：

看標竿：歐美零售與製造龍頭，怎麼用 AI 改寫營運流程
看實戰：台灣 Partner 分享在地企業導入心得與價值成效
拿路線圖：從資料、工具到 Agent，掌握全流程導入地圖

👉 立即報名（名單採審核制）

GPT-5.2 匆忙上線：OpenAI 在急什麼？聖誕更新可能才是重頭戲

高下立判我只能這麼說，大家可以忽略 ChatGPT 5.2 說的話，基本上我完全看不懂他說的

這次 ChatGPT 5.2 的上線，可以說是內憂外患。

一方面，根據華爾街日報的資訊，OpenAI 內部其實有人主張「再等等、再多打磨一下」；但另一方面，外部壓力也非常明確——Gemini 3 與 Claude Opus 4.5 正在正面逼近，而且不只是在單一 benchmark 上，而是整體體感、敘事與市場聲量。

在這樣的情況下，GPT-5.2 更像是一支在弦上的箭。
OpenAI 對 GPT-5.2 的定位是：「目前最適合專業知識型工作的模型」。

這個說法主要來自一項名為 GDPval 的基準測試。和我們熟悉的數學、推理或 coding benchmark 不同，GDPval 評估的是 AI 在真實工作場景的表現，例如：整理試算表、撰寫簡報內容等等...

在這套測試中，GPT-5.2 Thinking 模式，有 71% 的表現不輸產業中的專業人士。這也是 OpenAI 用來強調的一個關鍵訊號：GPT-5.2 不只是「好用的助理」，而是開始能穩定接手白領工作流程中的一部分任務。

那這次 GPT-5.2 的更新重點是什麼呢？我們節錄了幾個值得關注的：
- 視覺理解能力顯著提升（不過還是輸 Gemini，詳情可以看這篇）
- 工具呼叫與工作流程協同能力更強（篇幅有點長，寫在第五則，比較技術性一點）
- 幻覺（Hallucination）率下降
- 更強的多步推理與連貫性

觀察筆記

老實說，比起基準測試，我自己更在意的是另外三件事。

可信度。它的回答看起來很聰明，但問題是：你真正「相信它」的比例有多少？在專業與非專業的問答下，它能不能給出正確、而不只是「聽起來合理」的回答，這對我來說才是關鍵。
它是否真的「熟悉你」。很多時候，我們丟給 AI 的問題，其實是連自己都還沒想清楚的問題。這非常吃重對情境、情感，以及對於使用者的理解。但目前社群對 GPT-5.2 的討論，卻頻繁出現像是 cold、lack of basic comprehension 這類形容。

在記憶這件事上，我自己的感受是：從 GPT-5 之後，就算搭配 Project 功能，還是很常出現「記憶混亂」的狀況。模型記得很多，但不一定記得對。
功能多元性，就是純比功能廣度、整合深度。但老實說，現在沒有一個打得過 Gemini，所以在碰到多元情境下，換模型使用通常會是最優解。

雖然「脫 ChatGPT、入 Gemini」已經成為社群 meme，但我腦中一直浮現上一次聖誕節 Sam Altman 戴著聖誕帽，連續好幾天開直播，一天一個更新的畫面，每天都有新內容 XD。

也難怪現在外媒都在傳：OpenAI 很可能把真正的底牌留在聖誕檔期。
拜託，真的要有，不然想靠 GPT-5.2 就堵住大家的嘴，是真的很有挑戰性。