遇见Audiobox,Meta的新一代生成AI,可以克隆声音
当你遇见Audiobox,Meta最新一代的智能AI声音克隆系统
Meta发布了他们最新生成的人工智能(AI)Demo,名为Audiobox
它的标语是“任何人都可以用一个想法制作声音”,这款新的AI建立在他们以前的语音生成AI Voicebox的基础上,并取代了它。
根据社交媒体巨头的一篇博文,Audiobox有所改进,因为它将语音生成与音效和音景生成结合在一起,大大增加了可能性。该工具的网页上写着:“它可以使用语音输入和自然语言文本提示来生成声音和音效,轻松地为各种用例创建自定义音频。”
Starting today you can try our new foundation research model for audio generation. The demo includes Zero shot TTS, Text to sound effects, Infilling and more!
Try Audiobox ➡️ https://t.co/8OPcJYy8a9 pic.twitter.com/lo9rCOZMAh
- 苹果向开发者发布iOS 17.3和iPadOS 17.3的首个测试版’ (Píngguǒ x...
- 最适合苹果粉丝和iPhone、iPad和Mac机主的礼物 | ENBLE
- iOS 17:关于苹果公司的新日记应用的知识
— AI at Meta (@AIatMeta) December 11, 2023
只需要输入您想要AI说的句子,选择您想要听到它的声音或者您想要它创建的音效,Audiobox就会为您生成。但您也可以进一步深入,录制自己的声音,并使用生成的版本与工具进行对话。只需要录制一两句话,就能获得令人难以置信的准确结果。
用户可以立即使用该工具,但是Meta明确表示,目前的发布仅用于研究演示,并且“不得用于任何商业目的”。它还规定了德克萨斯州和伊利诺伊州的居民不能使用该工具。 VentureBeat报道称,这是因为州法律禁止为Demo提供所需的音频数据收集。
对AI和社会的担忧
今年早些时候,Facebook的所有者解散了他们的“负责任AI”团队,而更倾向于加大对生成式AI的投入。随着他们最近将AI图像生成器扩展为一个独立工具,Audiobox的发布明显是朝着这个方向迈出的一步。这两个新工具都不是开源的,这在Meta发布了Llama 2(ChatGPT和其他大型语言模型的开源竞争对手)之后是一个令人惊讶的举动。
在与演示同时发布的博文或研究论文中,没有提到为这个模型进行的数据收集的性质。这无疑会引起人们的注意,因为世界正在努力理解AI模型如何符合版权法。
精选图片:The Digital Artist/Pixabay