Google 推出 Veo 3.1 模型:為 AI 影片創作帶來更豐富音訊與精確編輯

Google 於 2025 年 10 月 15 日宣布推出 Veo 3.1 影片生成模型,並大幅強化其 AI 電影製作工具 Flow 的功能。自五個月前推出 Flow 以來,該平台已生成超過 2.75 億支影片,顯示市場對 AI 影片工具的強勁需求。此次更新著重在提升音訊品質、增強敘事控制能力,以及為創作者提供更精細的編輯工具。

Google 推出 Veo 3.1 模型:為 AI 影片創作帶來更豐富音訊與精確編輯

Veo 3.1 核心技術升級

Veo 3.1 是建立在 Veo 3 基礎上的進化版本,帶來三大核心改進。首先是增強的現實感與提示遵循度:新模型能生成更逼真的影片,更準確地理解並執行複雜的文字指令,減少視覺瑕疵並提升物體在場景中的持續性。這意味著創作者不需要反覆重新生成就能獲得可用的鏡頭。​

其次是更豐富的原生音訊:Veo 3.1 能生成自然對話、同步音效和環境音,讓影片更具沉浸感。第三項突破是增強的圖像轉影片功能,在將靜態圖片轉換為動態影片時,能更好地保持角色一致性和場景連貫性,同時提升音訊與視覺品質。​

0:00
/1:30

技術規格與性能表現

Veo 3.1 支援 1080p HD 解析度輸出,並能生成長達 30 秒的高解析度影片,未來預計可達一分鐘。模型提供標準版和 Veo 3.1 Fast 輕量版,後者針對速度進行最佳化。兩個版本都支援水平(16:9)和垂直(9:16)格式,適合不同平台的內容創作需求。​

在角色一致性方面,Veo 3.1 解決了前代版本在背景和臉部連貫性上的問題。新模型採用精煉的潛在追蹤記憶系統,能在多個鏡頭間維持臉部、服裝、燈光和環境的一致性。此外,模型內建電影預設功能,創作者只需簡單指令就能觸發追蹤、推軌、變焦和空拍等專業攝影機運動,以及黃金時段、柔和工作室燈光等照明選項。

探索 Veo 3.1:AI 影片創作的三大革新功能

AI 影片生成技術正以前所未有的速度進化,而 Google 最新推出的 Veo 3.1 更將影像與音訊結合推向新境界。以下將透過三大核心功能,帶您一覽 Veo 3.1 如何簡化製作流程、強化敘事張力,並賦予創作者更大彈性與表現力。

一、多圖素材轉影片:從靜態到動態,一鍵生成沉浸式短片

傳統將素材組合為影片,需要繁複剪輯與調色,現在只要準備多張參考圖片,Veo 3.1 的「成分轉影片」(Ingredients to Video) 功能便能在 AI 助力下,一次性完成視覺與音效的整合。無論是不同人物、物件,甚至複雜場景,Veo 都會自動渲染陰影、環境音與同步對話,創造出宛如劇院級的短片效果。

0:00
/0:43

二、場景延伸:無縫銜接,打造長鏡頭敘事

延伸影片片段往往是製作長片或連續敘事的難題;Veo 3.1 的「場景延伸」(Scene Extension) 功能,巧妙利用前一段最後一秒畫面,持續生成後續影像,並維持背景、人物一致性。長達一分鐘以上的連續鏡頭,不僅省去重拍成本,也能讓劇情流暢不間斷,輕鬆實現史詩級長景深效果。

0:00
/0:29

三、首尾幀過渡:Epic 轉場,連接幻想與現實

想在兩張截然不同的影像間創造驚豔轉場?Veo 3.1 的「從 A 到 B」(From A to B) 功能正是為此而生。只需上傳第一帧與最後一帧,AI 即可在二者之間生成完整、無縫的影片過渡,保留前後景深與音軌連貫,提供彷彿電影級的視聽體驗,讓任何創意點子瞬間具象化。

0:00
/0:39

透過這三大功能,Veo 3.1 不僅讓 AI 影片生成更智慧,也大幅簡化了創作流程。從參考素材到延伸場景,再到史詩級轉場,Google Flow 平台上的 Veo 3.1 將成為影片創作者的新利器,為短片、廣告、微電影等各種創作注入源源動能。

Flow 新增強大編輯功能

Google 為 Flow 加入多項創新編輯工具,大幅提升創作彈性。「插入」(Insert)功能允許創作者在已生成的影片中添加任何元素,從寫實細節到奇幻生物,AI 會自動處理陰影和場景光線,讓新增物件自然融入。例如,在城市景觀影片中加入一輛經典汽車時,Veo 3.1 會渲染正確的光線、反射和動態模糊,確保與現有場景無縫接合。​

即將推出的**「移除」功能**則能讓用戶移除場景中的物件或角色,AI 會重建背景和周圍環境,讓畫面看起來彷彿該物件從未存在。這種添加與移除的能力,將 AI 影片創作從線性流程轉變為動態的迭代過程。​

音訊功能全面整合

此次更新最顯著的特色是將音訊功能整合到 Flow 的所有既有工具中:​

  • 「成分轉影片」(Ingredients to Video):用戶可上傳多張參考圖片(最多 3 張)控制角色、物件和風格,Flow 會根據這些素材創建符合願景的場景,現在還加入豐富的音訊​
  • 「幀至影片」(Frames to Video):提供起始和結束圖像,Flow 會生成無縫銜接的過渡影片,適合藝術性和史詩級轉場效果,現在同樣搭配音訊​
  • 「延伸」(Extend):能創建長達一分鐘以上的連續影片,根據前一片段的最後一秒生成續集,保持動作連貫性,對建立長景深鏡頭特別有用

開發者與企業應用

Veo 3.1 和 Veo 3.1 Fast 已透過 Gemini APIVertex AI 和 Gemini 應用程式向開發者和企業用戶開放。在 Google AI Studio 中,開發者可程式化存取這些模型,實現更靈活的整合應用。​

API 支援三項新功能:使用參考圖片引導影片生成、延伸先前生成的 Veo 影片,以及透過指定首尾幀生成過渡影片。開發者可透過簡單的程式碼呼叫,將 Veo 3.1 的能力整合到自己的應用程式中。​

使用方案與市場定位

Flow 目前提供給美國地區的 Google AI Pro 和 Google AI Ultra 方案訂閱用戶使用,未來將擴展到更多國家。AI Pro 方案每月提供 100 次生成額度和核心功能存取,而 Ultra 方案則提供更高使用限額並可優先體驗原生音訊生成等新功能。​

在競爭激烈的 AI 影片生成市場中,Veo 3.1 與 OpenAI 的 Sora 2.0 等競品展開直接競爭。Google 強調 Veo 3.1 在提示遵循度、電影級輸出品質,以及物理真實感方面的優勢。Flow 作為唯一專為 Google 最先進模型(Veo、Imagen 和 Gemini)客製化的 AI 電影製作工具,整合了這些模型的協同優勢。​

創作者社群與未來展望

Flow 內建 Flow TV 功能,展示由社群生成的精選影片片段。用戶不僅能瀏覽作品,還能查看確切的提示詞和技術細節,提供實用的學習方式讓創作者適應新風格。這種透明度有助於建立創作者社群並促進知識分享。​

Google 強調 Flow 是「由創作者為創作者打造」的工具,在開發過程中廣泛徵詢電影製作人的意見。Dave Clark、Henry Daubrez 和 Junie Lau 等導演已使用 Flow 製作短片,他們的回饋協助精煉了場景建構器、資產管理工具等功能。​

隨著 AI 影片生成技術持續演進,Veo 3.1 代表 Google 在這個領域的最新里程碑。從單純的文字轉影片,到現在具備完整音訊、精細編輯和專業級控制的綜合創作平台,AI 電影製作正快速從概念驗證階段邁向實用工具的新時代。