veo3.1

Google 推出 Veo 3.1 模型:為 AI 影片創作帶來更豐富音訊與精確編輯

Google 於 2025 年 10 月 15 日宣布推出 Veo 3.1 影片生成模型,並大幅強化其 AI 電影製作工具 Flow 的功能。自五個月前推出 Flow 以來,該平台已生成超過 2.75 億支影片,顯示市場對 AI 影片工具的強勁需求。此次更新著重在提升音訊品質、增強敘事控制能力,以及為創作者提供更精細的編輯工具。

Philo

16 Oct 2025 — 9 min read

Veo 3.1 核心技術升級

Veo 3.1 是建立在 Veo 3 基礎上的進化版本,帶來三大核心改進。首先是增強的現實感與提示遵循度:新模型能生成更逼真的影片,更準確地理解並執行複雜的文字指令,減少視覺瑕疵並提升物體在場景中的持續性。這意味著創作者不需要反覆重新生成就能獲得可用的鏡頭。

其次是更豐富的原生音訊:Veo 3.1 能生成自然對話、同步音效和環境音,讓影片更具沉浸感。第三項突破是增強的圖像轉影片功能,在將靜態圖片轉換為動態影片時,能更好地保持角色一致性和場景連貫性,同時提升音訊與視覺品質。

0:00

/1:30

技術規格與性能表現

Veo 3.1 支援 1080p HD 解析度輸出,並能生成長達 30 秒的高解析度影片,未來預計可達一分鐘。模型提供標準版和 Veo 3.1 Fast 輕量版,後者針對速度進行最佳化。兩個版本都支援水平(16:9)和垂直(9:16)格式,適合不同平台的內容創作需求。

在角色一致性方面,Veo 3.1 解決了前代版本在背景和臉部連貫性上的問題。新模型採用精煉的潛在追蹤記憶系統,能在多個鏡頭間維持臉部、服裝、燈光和環境的一致性。此外,模型內建電影預設功能,創作者只需簡單指令就能觸發追蹤、推軌、變焦和空拍等專業攝影機運動,以及黃金時段、柔和工作室燈光等照明選項。

探索 Veo 3.1：AI 影片創作的三大革新功能

AI 影片生成技術正以前所未有的速度進化，而 Google 最新推出的 Veo 3.1 更將影像與音訊結合推向新境界。以下將透過三大核心功能，帶您一覽 Veo 3.1 如何簡化製作流程、強化敘事張力，並賦予創作者更大彈性與表現力。

一、多圖素材轉影片：從靜態到動態，一鍵生成沉浸式短片

傳統將素材組合為影片，需要繁複剪輯與調色，現在只要準備多張參考圖片，Veo 3.1 的「成分轉影片」(Ingredients to Video) 功能便能在 AI 助力下，一次性完成視覺與音效的整合。無論是不同人物、物件，甚至複雜場景，Veo 都會自動渲染陰影、環境音與同步對話，創造出宛如劇院級的短片效果。

0:00

/0:43

二、場景延伸：無縫銜接，打造長鏡頭敘事

延伸影片片段往往是製作長片或連續敘事的難題；Veo 3.1 的「場景延伸」(Scene Extension) 功能，巧妙利用前一段最後一秒畫面，持續生成後續影像，並維持背景、人物一致性。長達一分鐘以上的連續鏡頭，不僅省去重拍成本，也能讓劇情流暢不間斷，輕鬆實現史詩級長景深效果。

0:00

/0:29

三、首尾幀過渡：Epic 轉場，連接幻想與現實

想在兩張截然不同的影像間創造驚豔轉場？Veo 3.1 的「從 A 到 B」(From A to B) 功能正是為此而生。只需上傳第一帧與最後一帧，AI 即可在二者之間生成完整、無縫的影片過渡，保留前後景深與音軌連貫，提供彷彿電影級的視聽體驗，讓任何創意點子瞬間具象化。

0:00

/0:39

透過這三大功能，Veo 3.1 不僅讓 AI 影片生成更智慧，也大幅簡化了創作流程。從參考素材到延伸場景，再到史詩級轉場，Google Flow 平台上的 Veo 3.1 將成為影片創作者的新利器，為短片、廣告、微電影等各種創作注入源源動能。

Flow 新增強大編輯功能

Google 為 Flow 加入多項創新編輯工具,大幅提升創作彈性。「插入」(Insert)功能允許創作者在已生成的影片中添加任何元素,從寫實細節到奇幻生物,AI 會自動處理陰影和場景光線,讓新增物件自然融入。例如,在城市景觀影片中加入一輛經典汽車時,Veo 3.1 會渲染正確的光線、反射和動態模糊,確保與現有場景無縫接合。

即將推出的**「移除」功能**則能讓用戶移除場景中的物件或角色,AI 會重建背景和周圍環境,讓畫面看起來彷彿該物件從未存在。這種添加與移除的能力,將 AI 影片創作從線性流程轉變為動態的迭代過程。

音訊功能全面整合

此次更新最顯著的特色是將音訊功能整合到 Flow 的所有既有工具中:

「成分轉影片」(Ingredients to Video):用戶可上傳多張參考圖片(最多 3 張)控制角色、物件和風格,Flow 會根據這些素材創建符合願景的場景,現在還加入豐富的音訊
「幀至影片」(Frames to Video):提供起始和結束圖像,Flow 會生成無縫銜接的過渡影片,適合藝術性和史詩級轉場效果,現在同樣搭配音訊
「延伸」(Extend):能創建長達一分鐘以上的連續影片,根據前一片段的最後一秒生成續集,保持動作連貫性,對建立長景深鏡頭特別有用

開發者與企業應用

Veo 3.1 和 Veo 3.1 Fast 已透過 Gemini API、Vertex AI 和 Gemini 應用程式向開發者和企業用戶開放。在 Google AI Studio 中,開發者可程式化存取這些模型,實現更靈活的整合應用。

API 支援三項新功能:使用參考圖片引導影片生成、延伸先前生成的 Veo 影片,以及透過指定首尾幀生成過渡影片。開發者可透過簡單的程式碼呼叫,將 Veo 3.1 的能力整合到自己的應用程式中。

使用方案與市場定位

Flow 目前提供給美國地區的 Google AI Pro 和 Google AI Ultra 方案訂閱用戶使用,未來將擴展到更多國家。AI Pro 方案每月提供 100 次生成額度和核心功能存取,而 Ultra 方案則提供更高使用限額並可優先體驗原生音訊生成等新功能。

在競爭激烈的 AI 影片生成市場中,Veo 3.1 與 OpenAI 的 Sora 2.0 等競品展開直接競爭。Google 強調 Veo 3.1 在提示遵循度、電影級輸出品質,以及物理真實感方面的優勢。Flow 作為唯一專為 Google 最先進模型(Veo、Imagen 和 Gemini)客製化的 AI 電影製作工具,整合了這些模型的協同優勢。

創作者社群與未來展望

Flow 內建 Flow TV 功能,展示由社群生成的精選影片片段。用戶不僅能瀏覽作品,還能查看確切的提示詞和技術細節,提供實用的學習方式讓創作者適應新風格。這種透明度有助於建立創作者社群並促進知識分享。

Google 強調 Flow 是「由創作者為創作者打造」的工具,在開發過程中廣泛徵詢電影製作人的意見。Dave Clark、Henry Daubrez 和 Junie Lau 等導演已使用 Flow 製作短片,他們的回饋協助精煉了場景建構器、資產管理工具等功能。

隨著 AI 影片生成技術持續演進,Veo 3.1 代表 Google 在這個領域的最新里程碑。從單純的文字轉影片,到現在具備完整音訊、精細編輯和專業級控制的綜合創作平台,AI 電影製作正快速從概念驗證階段邁向實用工具的新時代。

Google 推出 Veo 3.1 模型:為 AI 影片創作帶來更豐富音訊與精確編輯

Philo

Veo 3.1 核心技術升級

技術規格與性能表現

探索 Veo 3.1：AI 影片創作的三大革新功能

一、多圖素材轉影片：從靜態到動態，一鍵生成沉浸式短片

二、場景延伸：無縫銜接，打造長鏡頭敘事

三、首尾幀過渡：Epic 轉場，連接幻想與現實

Flow 新增強大編輯功能

音訊功能全面整合

開發者與企業應用

使用方案與市場定位

創作者社群與未來展望

Read more

ChatGPT 成人模式涼了！OpenAI 再次喊卡，一周砍了三個計畫

2026 還在找代辦申請海外學校？我用 AI 投遞 25 間美研，拿下 CMU、Duke 等頂級 Offer 的流程

Claude Projects 完整教學：不懂技術也能打造專屬 AI 助理

【設計師的 AI 秘笈】Figma MCP 開放 Beta，4步驟一鍵產出代碼

Veo 3.1 核心技術升級

技術規格與性能表現

探索 Veo 3.1：AI 影片創作的三大革新功能

一、多圖素材轉影片：從靜態到動態，一鍵生成沉浸式短片

二、場景延伸：無縫銜接，打造長鏡頭敘事

三、首尾幀過渡：Epic 轉場，連接幻想與現實

Flow 新增強大編輯功能

音訊功能全面整合

開發者與企業應用

使用方案與市場定位

創作者社群與未來展望

📬 免費訂閱AI 郵報和我們一起探索！

Read more

ChatGPT 成人模式涼了！OpenAI 再次喊卡，一周砍了三個計畫

2026 還在找代辦申請海外學校？我用 AI 投遞 25 間美研，拿下 CMU、Duke 等頂級 Offer 的流程

Claude Projects 完整教學：不懂技術也能打造專屬 AI 助理

【設計師的 AI 秘笈】Figma MCP 開放 Beta，4步驟一鍵產出代碼

📬 免費訂閱AI 郵報
和我們一起探索！