「Stable Diffusion」推出生成式影片工具

Stable Diffusion的開發商Stability AI近期宣布了一項重大進展:推出了名為「Stable Video Diffusion」的新型生成式影片工具。這款工具基於Stable Diffusion的圖像模型,現已進入研究預覽階段。這項技術代表了生成式視頻領域的一個顯著進步,用於從單一圖像創建視頻。

Share
「Stable Diffusion」推出生成式影片工具

Stable Diffusion的開發商Stability AI近期宣布了一項重大進展:推出了名為「Stable Video Diffusion」的新型生成式影片工具。這款工具基於Stable Diffusion的圖像模型,現已進入研究預覽階段。這項技術代表了生成式視頻領域的一個顯著進步,用於從單一圖像創建視頻。

Stable Video Diffusion以兩種影像至視頻的模型形式推出,分別能夠生成14至25 frames的視頻片段,每秒frames數可在3至30之間調整。目前這個工具僅用於研究目的,尚不適用於實際世界或商業應用。Stability AI表示,通過外部評估,他們發現這些模型在用戶偏好研究中超越了領先的封閉模型,包括Runway和Pika Labs的文本至視頻平台​​​​。

值得注意的是,Stability AI在用戶偏好研究中顯示了這些由人類評估者在網頁介面評估的生成視頻,並讓他們根據視覺品質和對提示的遵循程度來評價視頻質量。然而即使在這些評估中Stable Video Diffusion的表現優於RunwayML和Pika Labs,Meta的新視頻模型Emu Video則在更大幅度上超越了這兩者,目前Emu Video可能仍然是最佳視頻模型,但它目前只作為研究論文和靜態網頁演示提供​​​​。

這些進展揭示了生成式視頻技術的快速發展和該領域潛力巨大的競爭環境。隨著這些模型的進一步完善和應用範圍的擴大,我們可期待未來在廣告、教育、娛樂等領域看到更多創新應用。

Read more

你可以外包工作,但你永遠無法外包學習

你可以外包工作,但你永遠無法外包學習

You can offload a task, or even a job, but you can never offload your learning. - Satya Nadella 前天,微軟 CEO Satya Nadella 在 X 發表了一篇長文,乍看之下很像心靈雞湯,但整段文章給了非常清晰的 AI 時代的學習框架,雖然微軟的重點是放在公司,但我看完後認為他提出的 Human Capital (人力資本) 跟 Token Capital (算力資本) 也符合我們一般人成長的邏輯。 他提到,在 AI 時代裡面必須同時建立兩種資本: Human Capital 人力資本: 你的知識、判斷力、人際關係、

lock-1