技術發展

Stability AI發布「Stable Video 3D」模型，3D生成再進化

Stability AI 最近推出了名為「Stable Video 3D」（SV3D）的創新模型，這款工具專門用於渲染3D影片，其核心優勢在於能夠從多個視角一致地呈現同一物件。這項技術是在公司早期的Stable Video Diffusion模型基礎上進行擴展，新增了深度層次，使其能夠根據單張圖片輸入，創建並轉換成多視角的3D影片。

Stability AI 最近推出了名為「Stable Video 3D」（SV3D）的創新模型，這款工具專門用於渲染3D影片，其核心優勢在於能夠從多個視角一致地呈現同一物件。這項技術是在公司早期的Stable Video Diffusion模型基礎上進行擴展，新增了深度層次，使其能夠根據單張圖片輸入，創建並轉換成多視角的3D影片。

SV3D的關鍵特色是生成物件時保持高度的視角一致性，確保從任何角度觀看都能獲得一致的視覺體驗。Stability AI 指出，過去在將2D模型適應新視角合成（NVS）時，常遇到的挑戰是視角不一致性。SV3D通過其先進的生成新視角技術，能夠直接生成3D網格，解決了這一問題。

該模型不僅是遊戲開發中創建3D物件的強大工具，也在電子商務領域展現出巨大潛力，能夠提供360度全方位視角的影片，為消費者帶來更加沉浸式的購物體驗。

SV3D分為兩個版本：SV3D_u和SV3D_p。SV3D_u能夠僅憑一張圖片輸入，無需任何額外的鏡頭位置參數或圖片，就能生成3D影片。而SV3D_p則能結合單張圖片和軌道視圖，生成沿特定攝影機路徑的3D影片。

此外，Stability AI在去年底已經推出了首款3D生成模型「Stable Zero123」，而SV3D可視為其改進版，提供了新的視角合成網絡。與基於Stable Diffusion的Stable Zero123相比，SV3D基於Stable Video Diffusion模型，能夠一次性輸出多個視角，進一步擴展了應用範圍。

SV3D目前已向Stability AI的會員開放，用於商業用途，而非商業用途的使用者則可以通過Hugging Face平台下載模型權重。

【設計師的 AI 秘笈】Codex + Cowart 畫布標註，讓 AI 一秒讀懂你要改哪裡

用文字下 prompt，AI 修圖總是差一點？打開 Codex 內建瀏覽器 + 畫布工具，直接在圖上畫箭頭、寫指令，讓 gpt-image-1.5 精準抓到「改哪、怎麼改」。本文整理 2026 電商修圖 SOP，含標註公式、抽卡策略與實戰範例。

Meta 推出 Muse Image！AI 圖像設計師進駐你的手機裡

生成式 AI 圖像市場愈來愈擁擠，OpenAI、Google、Adobe 等公司都在持續更新模型。Meta 最新推出的 Muse Image，表面上是旗下第一個由 Meta Superintelligence Labs（MSL）打造的圖片生成模型，但從官方公布的內容來看，它的定位並不只是另一款 AI 繪圖工具。整合至 Meta AI，支援文字生成圖片、照片編修、草圖修改與局部重繪，同時也將陸續導入 Instagram、Facebook、Messenger、WhatsApp 等服務。

Fable 5 延長到 7/13！先看別人怎麼玩，再把它的腦搬走

進入本週大事之前，先跟大家報告一件事：我和 Davin 受 NVIDIA 邀請，擔任 7/26《RTX AI PC 驅動您的 AI 世界講座》的講者，當天我也會在現場分享。這次的主題是「AIPost 怎麼做的：用 RTX AI PC 打造 AI-native 媒體與知識團隊」。我們會示範怎麼用 RTX AI PC 當地端運算核心，搭配 AI Agent，把新聞資訊流、影片管理和內部流程自動化，串成一套私有的 AI 工作流；也會聊到企業導入的場景，地端 AI 在隱私、成本和效率上，能為團隊帶來哪些真實的生產力提升。這段時間實際用 AI

PlayStation 確認使用 AI 生成合成語音和美術！取代臨時素材，「加速開發，不是降低成本」

Sony 在最新 Q&A 中透露 PlayStation 工作室正積極使用生成式 AI 工具，生成合成語音（synthetic voices）與美術資產，作為開發早期階段的佔位符（placeholders）。這一做法主要目的是移除重複性工作、加速迭代並提升最終輸出品質，而非單純降低成本。

Read more

【設計師的 AI 秘笈】Codex + Cowart 畫布標註，讓 AI 一秒讀懂你要改哪裡

Meta 推出 Muse Image！AI 圖像設計師進駐你的手機裡

Fable 5 延長到 7/13！先看別人怎麼玩，再把它的腦搬走

PlayStation 確認使用 AI 生成合成語音和美術！取代臨時素材，「加速開發，不是降低成本」