Meta開源AudioCraft工具包,開啟AI音樂創作新時代

人工智能(AI)技術的快速發展使得AI在多個領域都展現出了巨大的潛力。其中,生成式AI成為引人注目的領域之一,能夠根據特定指令或文本描述創造出音頻、圖像和文本等。最近,Meta(前稱Facebook)釋出了一個開源的AudioCraft工具包,旨在幫助藝術家和聲音設計師更輕鬆地使用生成式AI來創作音頻作品。

Meta開源AudioCraft工具包,開啟AI音樂創作新時代

突破AI音頻創作的限制

人工智能(AI)技術的快速發展使得AI在多個領域都展現出了巨大的潛力。其中,生成式AI成為引人注目的領域之一,能夠根據特定指令或文本描述創造出音頻、圖像和文本等。最近,Meta(前稱Facebook)釋出了一個開源的AudioCraft工具包,旨在幫助藝術家和聲音設計師更輕鬆地使用生成式AI來創作音頻作品。

AudioCraft工具包激發藝術家創意

這個名為「AudioCraft」的工具包內含三個現有的生成式AI模型:AudioGen、MusicGen和EnCodec。其中,AudioGen和MusicGen分別用於生成音效和音樂,而EnCodec則負責壓縮聲音以產生更高質量的結果。這些功能將有助於藝術家創作豐富多樣的音頻內容,激發他們的創作靈感。

對於想要快速入門的用戶,Meta提供了預先訓練的AudioGen模型,使他們能夠迅速上手。同時研究人員和開發者也可訪問整個AudioCraft的代碼和模型權重,這對於那些希望使用自己的數據進行模型訓練的專業人士非常寶貴。據Meta表示,所有預先訓練的模型都使用公共數據或Meta擁有的材料,因此使用者無需擔心版權爭議。

AI音頻在音樂領域的潛力

Meta相信,AudioCraft的推出將使生成式AI音頻變得更加簡單和易於使用。當AI生成的圖像和文本已經受到廣泛歡迎時,音頻領域卻相對滯後。現有的音頻生成項目往往複雜且不易開放,而AudioCraft的出現將填補這一空白,讓創作者更加靈活地應用AI技術,豐富他們的創作。

值得一提的是,除了Meta的AudioCraft,谷歌於前幾個月也推出了其MusicLM模型。不過,Meta的系統並非針對普通用戶設計,使用AudioCraft仍然需要一定的技術。目前主要專注於研究用途,Meta表示他們正致力於提升這些模型的性能和控制方法,擴大其潛力。

音樂創作者探索新境界

儘管如此,AudioCraft的問世依然預示著AI在音樂創作中的未來角色。雖然藝術家不太可能完全依賴AI取代自身創造力,但這些工具將使他們更容易創建伴奏、樣本和其他音頻元素,並為音樂創作帶來新的可能性。隨著AI技術的不斷演進,我們或許將見證更多音樂創作領域與AI的有趣交融。

(原文出自:https://www.engadget.com/meta-releases-an-open-source-ai-kit-that-creates-audio-from-text-prompts-152026368.html)

Read more

【AI影音工具】2025年最佳影片生成 AI 工具評比+選擇指南:從社群短片到電影級製作,AI 正在重寫內容產業的成本公式

【AI影音工具】2025年最佳影片生成 AI 工具評比+選擇指南:從社群短片到電影級製作,AI 正在重寫內容產業的成本公式

AI 影片夯的真正原因 當今幾乎所有人都在談影片生成 AI。從 Instagram 上的個人創作者、行銷短片,到品牌端導入 Runway、Pika、Kling 等工具,生成影片似乎正走向「一鍵完成」的自動化時代。但若僅將它視為行銷工具或短影音解法,可能低估了 AI 影片生成背後真正的價值。 過去十年,內容產業最大的矛盾之一在於:觀眾對「視覺品質」的期待不斷提升,而影片製作的邊際成本卻無法下降。 一部中型預算的美劇,每集平均成本已突破 500–1,000 萬美元;《The Mandalorian》使用虛擬製片技術後,單季預算仍高達 1 億美元。而在遊戲產業,一款 3A 級大作的開發成本普遍落在 1–2 億美元之間,如《The Last of Us

lock-1