技術發展

「Stable Diffusion」推出生成式影片工具

Stable Diffusion的開發商Stability AI近期宣布了一項重大進展：推出了名為「Stable Video Diffusion」的新型生成式影片工具。這款工具基於Stable Diffusion的圖像模型，現已進入研究預覽階段。這項技術代表了生成式視頻領域的一個顯著進步，用於從單一圖像創建視頻。

Stable Video Diffusion以兩種影像至視頻的模型形式推出，分別能夠生成14至25 frames的視頻片段，每秒frames數可在3至30之間調整。目前這個工具僅用於研究目的，尚不適用於實際世界或商業應用。Stability AI表示，通過外部評估，他們發現這些模型在用戶偏好研究中超越了領先的封閉模型，包括Runway和Pika Labs的文本至視頻平台。

值得注意的是，Stability AI在用戶偏好研究中顯示了這些由人類評估者在網頁介面評估的生成視頻，並讓他們根據視覺品質和對提示的遵循程度來評價視頻質量。然而即使在這些評估中Stable Video Diffusion的表現優於RunwayML和Pika Labs，Meta的新視頻模型Emu Video則在更大幅度上超越了這兩者，目前Emu Video可能仍然是最佳視頻模型，但它目前只作為研究論文和靜態網頁演示提供。

這些進展揭示了生成式視頻技術的快速發展和該領域潛力巨大的競爭環境。隨著這些模型的進一步完善和應用範圍的擴大，我們可期待未來在廣告、教育、娛樂等領域看到更多創新應用。

Qwen3.8-Max 發布：2.4 兆參數、Max 級開放權重，真正重點是長時間 AI Agent

Qwen3.8-Max 不只追求回答更難的問題，而是要讓 AI Agent 持續工作數小時甚至數天。一次看懂 2.4 兆參數、官方評測、API 與開放權重時程。

Codex 子代理省額度教學：Sol 決策、Luna 執行，ChatGPT Plus 怎麼用得更有效率？

教你在 Codex 建立 GPT-5.6 Luna 子代理，讓 Sol 負責決策、Luna 處理搜尋、整理與測試，並釐清 Plus、Pro 20x 與 Max 推理強度的差別。

Gemini Robotics 2 控制 Apollo 2 人形機器人執行全身動作

Gemini Robotics 2 是什麼？Google DeepMind 讓機器人學會全身控制、多步驟推理與團隊協作

Google DeepMind 發布 Gemini Robotics 2，讓人形機器人能走路、蹲下、抓取與完成多步驟任務，並支援多機器人協作與本機運行。

AMD Helios 是什麼？對抗 NVIDIA 的 AI 機櫃級系統，為何企業更在意整櫃而非單張 GPU

AMD 推出 Helios AI 機櫃級系統，預計 2026 年底出貨，挑戰 NVIDIA 的資料中心方案。本文解釋 rack-scale、客戶布局與 AI 算力需求。

Read more

Qwen3.8-Max 發布：2.4 兆參數、Max 級開放權重，真正重點是長時間 AI Agent

Codex 子代理省額度教學：Sol 決策、Luna 執行，ChatGPT Plus 怎麼用得更有效率？

Gemini Robotics 2 是什麼？Google DeepMind 讓機器人學會全身控制、多步驟推理與團隊協作

AMD Helios 是什麼？對抗 NVIDIA 的 AI 機櫃級系統，為何企業更在意整櫃而非單張 GPU