OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

在一個示例中,一名英語用戶的聲音被翻譯成多種語言,包括西班牙語、國語、德語、法語和日語,同時保留了原說話者的口音,這項技術不僅展示了OpenAI在提供高品質語音方面的能力,也引發了對於語音合成技術可能帶來的影響的討論,包括對配音員、影音內容製作等領域的潛在影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。官網視聽

儘管OpenAI的Voice Engine展現了令人驚艷的成果,但公司對於這項技術的推廣採取了謹慎的態度,目前僅進行小範圍的限定測試。這種謹慎的態度反映了OpenAI對於技術濫用的擔憂,特別是在語音合成技術可能對配音員、影音內容製作等領域帶來影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。

OpenAI強調,他們對於採用Voice Engine技術的合作夥伴都嚴格規範,禁止任何未經同意的使用情況,並且有針對產生的語音加入可追蹤原始來源的水印。此外,OpenAI提出了一系列措施,包括逐步淘汰以語音進行身分認證的敏感服務的驗證機制,以及開發追蹤視聽內容來源的技術,以確保人們在與真人或AI互動時能夠清晰辨識。

Read more

Meta 正在「收購」OpenAI?只是用更狠毒的方式

Meta 正在「收購」OpenAI?只是用更狠毒的方式

上週大家過得還好嗎? 這次丹娜絲颱風給台灣帶來的災情不小,南部和東部尤其嚴重。我的台南老家也被摧毀了,今天南下的高速公路充滿了倒掉的樹。寫這封週報的時候,其實心裡還掛著很多事,但還是想把這週值得關注的 AI 新聞整理好。希望大家都平安,也別忘了在忙碌之餘多多關心身邊的人。 讓我們轉換心情!這週也一樣,精選 5 則值得關注的 AI 新聞,搭配一段觀察筆記, 讓你不只是看熱鬧,也能看懂門道。 本週焦點事件 1. Meta 正在「收購」OpenAI? 2. Google Veo 3 結束測試,全球開放! 3. 針對 300 位軟體高層做的調查報告,揭露 AI 軟體公司的新成長曲線 4. Spotify 爆紅神秘樂團,其實是 AI 生的? 5. AI 幫助一對夫妻成功懷孕?

lock-1
【影音工具教學】用一張照片,拍出電影級特效?Higgsfield 把這件事變簡單了

【影音工具教學】用一張照片,拍出電影級特效?Higgsfield 把這件事變簡單了

過去,電影裡那些超誇張的鏡頭,都是一群專業團隊花大錢、大把時間才拍出來的。 比如《駭客任務》的子彈時間,為了讓主角在空中定格旋轉,現場要擺上幾十台相機,每台各拍一張,再拼成一段連貫的動畫。 但現在,只要一張照片,一個按鈕。 Higgsfield,直接讓 AI 幫你拍出這種級別的特效。

lock-1