「Stable Diffusion」推出生成式影片工具

Stable Diffusion的開發商Stability AI近期宣布了一項重大進展:推出了名為「Stable Video Diffusion」的新型生成式影片工具。這款工具基於Stable Diffusion的圖像模型,現已進入研究預覽階段。這項技術代表了生成式視頻領域的一個顯著進步,用於從單一圖像創建視頻。

「Stable Diffusion」推出生成式影片工具

Stable Diffusion的開發商Stability AI近期宣布了一項重大進展:推出了名為「Stable Video Diffusion」的新型生成式影片工具。這款工具基於Stable Diffusion的圖像模型,現已進入研究預覽階段。這項技術代表了生成式視頻領域的一個顯著進步,用於從單一圖像創建視頻。

Stable Video Diffusion以兩種影像至視頻的模型形式推出,分別能夠生成14至25 frames的視頻片段,每秒frames數可在3至30之間調整。目前這個工具僅用於研究目的,尚不適用於實際世界或商業應用。Stability AI表示,通過外部評估,他們發現這些模型在用戶偏好研究中超越了領先的封閉模型,包括Runway和Pika Labs的文本至視頻平台​​​​。

值得注意的是,Stability AI在用戶偏好研究中顯示了這些由人類評估者在網頁介面評估的生成視頻,並讓他們根據視覺品質和對提示的遵循程度來評價視頻質量。然而即使在這些評估中Stable Video Diffusion的表現優於RunwayML和Pika Labs,Meta的新視頻模型Emu Video則在更大幅度上超越了這兩者,目前Emu Video可能仍然是最佳視頻模型,但它目前只作為研究論文和靜態網頁演示提供​​​​。

這些進展揭示了生成式視頻技術的快速發展和該領域潛力巨大的競爭環境。隨著這些模型的進一步完善和應用範圍的擴大,我們可期待未來在廣告、教育、娛樂等領域看到更多創新應用。

Read more

【ChatGPT Agent】AI 現在不只會想,還能「動手做」!從研究到行動的新里程碑

【ChatGPT Agent】AI 現在不只會想,還能「動手做」!從研究到行動的新里程碑

2025 年 7 月,OpenAI 正式推出 ChatGPT Agent 模式,這是一個結合 AI 推理力與實際操作能力的全新技術突破。從「幫你規劃晚餐並購買食材」到「分析競品並生成簡報」,ChatGPT 不再只是對話模型,而是變成你身邊最懂事、會執行的數位助理。 🔍 ChatGPT Agent 是什麼?一個能幫你完成任務的 AI ChatGPT Agent 是 OpenAI 打造的一套「代理型系統(agentic system)」,它能主動選擇工具、執行網頁操作、分析資料並產出結果。你可以給它任務指令,像是: * 根據行事曆與新聞準備客戶會議簡報 * 幫你查資料、做分析,並整理成 Excel 或 PPT 幫你規劃與預訂旅行行程、晚餐聚會等 它會自己打開網頁、篩選內容、下載檔案、