Meta開源AudioCraft工具包,開啟AI音樂創作新時代

人工智能(AI)技術的快速發展使得AI在多個領域都展現出了巨大的潛力。其中,生成式AI成為引人注目的領域之一,能夠根據特定指令或文本描述創造出音頻、圖像和文本等。最近,Meta(前稱Facebook)釋出了一個開源的AudioCraft工具包,旨在幫助藝術家和聲音設計師更輕鬆地使用生成式AI來創作音頻作品。

Meta開源AudioCraft工具包,開啟AI音樂創作新時代

突破AI音頻創作的限制

人工智能(AI)技術的快速發展使得AI在多個領域都展現出了巨大的潛力。其中,生成式AI成為引人注目的領域之一,能夠根據特定指令或文本描述創造出音頻、圖像和文本等。最近,Meta(前稱Facebook)釋出了一個開源的AudioCraft工具包,旨在幫助藝術家和聲音設計師更輕鬆地使用生成式AI來創作音頻作品。

AudioCraft工具包激發藝術家創意

這個名為「AudioCraft」的工具包內含三個現有的生成式AI模型:AudioGen、MusicGen和EnCodec。其中,AudioGen和MusicGen分別用於生成音效和音樂,而EnCodec則負責壓縮聲音以產生更高質量的結果。這些功能將有助於藝術家創作豐富多樣的音頻內容,激發他們的創作靈感。

對於想要快速入門的用戶,Meta提供了預先訓練的AudioGen模型,使他們能夠迅速上手。同時研究人員和開發者也可訪問整個AudioCraft的代碼和模型權重,這對於那些希望使用自己的數據進行模型訓練的專業人士非常寶貴。據Meta表示,所有預先訓練的模型都使用公共數據或Meta擁有的材料,因此使用者無需擔心版權爭議。

AI音頻在音樂領域的潛力

Meta相信,AudioCraft的推出將使生成式AI音頻變得更加簡單和易於使用。當AI生成的圖像和文本已經受到廣泛歡迎時,音頻領域卻相對滯後。現有的音頻生成項目往往複雜且不易開放,而AudioCraft的出現將填補這一空白,讓創作者更加靈活地應用AI技術,豐富他們的創作。

值得一提的是,除了Meta的AudioCraft,谷歌於前幾個月也推出了其MusicLM模型。不過,Meta的系統並非針對普通用戶設計,使用AudioCraft仍然需要一定的技術。目前主要專注於研究用途,Meta表示他們正致力於提升這些模型的性能和控制方法,擴大其潛力。

音樂創作者探索新境界

儘管如此,AudioCraft的問世依然預示著AI在音樂創作中的未來角色。雖然藝術家不太可能完全依賴AI取代自身創造力,但這些工具將使他們更容易創建伴奏、樣本和其他音頻元素,並為音樂創作帶來新的可能性。隨著AI技術的不斷演進,我們或許將見證更多音樂創作領域與AI的有趣交融。

(原文出自:https://www.engadget.com/meta-releases-an-open-source-ai-kit-that-creates-audio-from-text-prompts-152026368.html)

Read more

Meta 收購語音新創 Play AI:加速佈局 AI 聲音技術與超級智慧計畫

Meta 收購語音新創 Play AI:加速佈局 AI 聲音技術與超級智慧計畫

Meta 正式收購語音 AI 新創公司 Play AI,進一步強化其在人工智慧領域的投資與佈局。根據 Bloomberg 報導,Meta 已向媒體證實這項收購,並透露 Play AI 的全體團隊將於下週加入 Meta。 Play AI 是一家專注於開發自然人聲合成技術的創業公司,透過 AI 模型生成逼真的語音,並打造一個簡便的語音創作平台。Meta 在內部備忘錄中指出,Play AI 的技術與平台非常契合 Meta 的未來發展藍圖,尤其是在 AI 虛擬角色(AI Characters)、Meta AI 助理、可穿戴裝置(Wearables)、以及音頻內容創作等應用上。 0:00 /0:34 1× 收購金額未公開,顯示 Meta