智能應用

從圖像到音頻，Stability AI 的擴散模型將改變音樂製作的遊戲規則

Stability AI，一家主要以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

Stability AI，以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

音頻擴散模型傾向於生成固定長度的音頻，這對音樂製作來說是一個問題，因為歌曲的長度可能會有所不同。Stability AI 的新平台允許用戶製作不同長度的聲音，這需要該公司在音樂上進行訓練，並添加有關歌曲開始和結束時間的文本元數據。

根據該公司的說法，它使用“由超過 800,000 個音頻文件組成的數據集進行訓練，這些文件包含音樂、音效和單一樂器的主幹音軌”，以及來自庫存音樂許可公司 AudioSparx 的文本元數據。該數據集代表了超過 19,500 小時的聲音。Stability AI 表示，通過與一家許可公司合作，它有權使用受版權保護的材料。

與其他生成式 AI 音頻平台一樣，Stable Audio 的潛在使用案例將主要用於製作Podcast或視頻的背景音樂，用以加快這些工作流程。Stability AI 也在去年宣布計劃擴展到音頻生成、視頻和 3D 圖像。

你可以外包工作，但你永遠無法外包學習

You can offload a task, or even a job, but you can never offload your learning. - Satya Nadella 前天，微軟 CEO Satya Nadella 在 X 發表了一篇長文，乍看之下很像心靈雞湯，但整段文章給了非常清晰的 AI 時代的學習框架，雖然微軟的重點是放在公司，但我看完後認為他提出的 Human Capital (人力資本) 跟 Token Capital (算力資本) 也符合我們一般人成長的邏輯。他提到，在 AI 時代裡面必須同時建立兩種資本： Human Capital 人力資本：你的知識、判斷力、人際關係、

【AI工具地圖】做網站總是像 AI 模板？我用 GSAP Skills做出高質感互動網站

Claude、Cursor 做網站總是長得一樣？本文實測利用 GSAP Skills 的互動設計思維，打造具有品牌特色的高質感網站 Demo。從參考網站拆解、Prompt 設計到實作完整分享。

SpaceX 斥資 600 億美元收購 AI 編程神器 Cursor：史上最大 AI 新創併購案全解析

Elon Musk 旗下 SpaceX 宣布以 600 億美元全股票方式收購 AI 程式碼編輯器 Cursor 的母公司 Anysphere，預計於 2026 年第三季完成交割。這筆交易是科技史上最大的 AI 新創收購案，也標誌著 SpaceX 正式以 AI 軟體工具為核心，向 Microsoft、Anthropic、OpenAI 全面宣戰。

Loop Engineering 是什麼？從 Prompt Engineering 進化到 AI 迴圈工程

當大家還在學怎麼寫好 Prompt，Google 工程師已經開始談「Loop Engineering」。這是一種用自動化迴圈取代人工提示 AI 的新工程方法：設計會自己尋找任務、提示 Agent、驗證結果並記錄狀態的 AI 工作流，正在改變工程師與 AI 協作的方式。

Read more

你可以外包工作，但你永遠無法外包學習

【AI工具地圖】做網站總是像 AI 模板？我用 GSAP Skills做出高質感互動網站

SpaceX 斥資 600 億美元收購 AI 編程神器 Cursor：史上最大 AI 新創併購案全解析

Loop Engineering 是什麼？從 Prompt Engineering 進化到 AI 迴圈工程