ChatGPT Images 2.0 完整介紹:GPT Image 2 功能、免費使用方式與 DALL-E 有何不同

OpenAI 於 2026 年 4 月 21 日推出 ChatGPT Images 2.0,底層模型 GPT Image 2 首度加入推理能力,文字渲染準確率近 99%、支援 2K 輸出、最多一次生成 8 張連貫圖片。Instant 模式對所有帳號免費開放,DALL-E 3 將於 5 月 12 日退役。

Share
ChatGPT Images 2.0 完整介紹:GPT Image 2 功能、免費使用方式與 DALL-E 有何不同

你是否曾因為 AI 生圖工具畫不出正確的文字、換個角度人物就對不上、或是生成的圖跟想像差太遠而感到挫折?這些問題在 2026 年 4 月 21 日之後,有了截然不同的答案。OpenAI 正式推出 ChatGPT Images 2.0,底層模型為 gpt-image-2,這是 OpenAI 有史以來第一個具備原生推理能力的圖像生成模型——它不只是畫圖,它會在動筆前先「想一想」。


目錄


什麼是 ChatGPT Images 2.0

ChatGPT Images 2.0 是 OpenAI 於 2026 年 4 月 21 日正式推出的新一代圖像生成系統,底層驅動模型為 gpt-image-2,可透過 ChatGPT 介面、Codex app 及 API 使用。

這次升級的核心突破,在於圖像生成首次整合了「推理能力」——模型在生成圖片之前,會先分析任務邏輯、決定構圖策略,甚至可以調用即時網路搜尋來獲取最新資訊,再開始實際繪製。OpenAI 將這個新系統定位為「視覺思考夥伴」,而不只是一個出圖工具。根據 Interesting Engineering 的報導,這代表 AI 圖像生成正式從「一次性輸出」進化成「可驗證的創作流程」。


GPT Image 2 五大核心功能

文字渲染精準度大幅提升,準確率約達 99%。 這款新模型是目前市場上文字渲染表現最可靠的 AI 圖像模型之一。不只英文,日文、韓文、中文、印地文、孟加拉文等十多種語言都獲得顯著改善,圖片內的標題、標語、品牌名稱幾乎不再出現錯字或字元扭曲的問題。

最高支援 2K 解析度輸出,長寬比自由設定。 圖片解析度從過去的標準尺寸大幅提升至 2K,API beta 版本更支援 4K 輸出。長寬比支援從 3:1(極寬橫幅)到 1:3(極高直幅),適合從橫版社群貼文到手機桌布等各種使用場景。

單一 prompt 最多一次生成 8 張連貫圖片。 在 Thinking 模式下,使用者可以用一個 prompt 同時生成最多 8 張具備角色一致性的圖片,適合用於漫畫分鏡、品牌視覺系列、產品多角度展示等需要畫面連貫的工作。

整合即時網路搜尋能力。 生圖過程中,模型可以呼叫網路搜尋來確認最新的視覺資訊,例如最新款產品外觀、建築物現況、或特定事件的視覺記錄。這讓知識截止日期(gpt-image-2 為 2025 年 12 月)的限制獲得部分補償。

對話式圖片編輯與局部修改。 ChatGPT Images 2.0 支援在對話中持續修改圖片,包含局部區域的精確編輯,操作邏輯類似「和設計師來回溝通修稿」,而不是每次重新生成整張圖。


Instant 模式 vs Thinking 模式

GPT Image 2 提供兩種截然不同的操作模式,對應不同的使用情境與速度需求。

還想解鎖更多精彩內容嗎?
完整內容只開放給註冊用戶✨
點擊下方「Subscibe now」,立即加入我們! 是免費喔~

Read more