OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

OpenAI推出語音引擎預覽版,15秒聲音合成多語言人聲

OpenAI最近公開了語音引擎(Voice Engine)的預覽版,這是一項能夠重現人聲的創新AI工具。這項功能允許用戶上傳一段15秒的語音樣本,然後將這些語音資料合成更多版本,目前已開放給少數公司進行測試。這項技術的亮點在於,它能夠產生情感豐富且自然真實的聲音,與原始說話者非常相似,並且在處理完成後會刪除所使用的音訊。

在一個示例中,一名英語用戶的聲音被翻譯成多種語言,包括西班牙語、國語、德語、法語和日語,同時保留了原說話者的口音,這項技術不僅展示了OpenAI在提供高品質語音方面的能力,也引發了對於語音合成技術可能帶來的影響的討論,包括對配音員、影音內容製作等領域的潛在影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。官網視聽

儘管OpenAI的Voice Engine展現了令人驚艷的成果,但公司對於這項技術的推廣採取了謹慎的態度,目前僅進行小範圍的限定測試。這種謹慎的態度反映了OpenAI對於技術濫用的擔憂,特別是在語音合成技術可能對配音員、影音內容製作等領域帶來影響,以及公眾對這類工具被不法分子用於詐騙或散播不實資訊的擔憂。

OpenAI強調,他們對於採用Voice Engine技術的合作夥伴都嚴格規範,禁止任何未經同意的使用情況,並且有針對產生的語音加入可追蹤原始來源的水印。此外,OpenAI提出了一系列措施,包括逐步淘汰以語音進行身分認證的敏感服務的驗證機制,以及開發追蹤視聽內容來源的技術,以確保人們在與真人或AI互動時能夠清晰辨識。

Read more

[AI郵報新年特輯] 2025 - 26 Top 5 AI 工具 & 大事件回顧

[AI郵報新年特輯] 2025 - 26 Top 5 AI 工具 & 大事件回顧

新年快樂,各位 AI 狂熱者!(文末有抽獎活動!抽十位 Manus 8000 積分 Pro 會員!) 在點開這封信、開始閱讀本週的週年回顧前,請先給螢幕前的自己鼓鼓掌。老實說,在農曆新年期間還能保持「開信」的慣性,基本上已經是 AI 成癮者了,如果開一個戒斷互助會,我想是沒有人會來的,因為就我們來說,用 AI 已經成為不想戒、不能戒的習慣了。 上週我們啟動了《AI 郵報》的年度訂戶調查(目前仍在進行中,點這裡前往填寫)。在後台看反饋時,有讀者對我們的題目設計蠻有興趣,私底下詢問我們「為什麼要問閱讀週報時,同時還在做什麼?」 這題看似閒聊,但其實是因為我之前研究 Netflix 的一個啟發。當大家在討論 Disney+ 或 YouTube 或是其他本地 OTT 對於

Elon Musk 確認 xAI 裁員——SpaceX 天價併購後的重組風暴與共同創辦人出走潮

Elon Musk 確認 xAI 裁員——SpaceX 天價併購後的重組風暴與共同創辦人出走潮

Elon Musk 確認 xAI 進行組織重組並裁員,距離 SpaceX 以 1.25 兆美元收購 xAI 僅一週多。這筆史上最大企業併購案的背後,是接連不斷的高層出走潮:12 位共同創辦人已有 6 人離職,包括 Tony Wu 和 Jimmy Ba 在 48 小時內相繼宣布離開。合併後的新公司計畫在 2026 年 IPO,但 Grok 聊天機器人面臨技術爭議與監管壓力,為這場天價 IPO 增添不確定性。