Audiobox:Meta的免费开源AI音频生成模型

Meta于2023年11月30日推出Audiobox,这是一款免费开源的AI语音和声音生成模型。该模型于12月11日上线在线网页版本,用户可免费体验其功能。作为Meta继Voicebox之后推出的最新一代音频生成模型,Audiobox能够结合语音输入和自然语言文本提示来生成语音和音效,从而让用户轻松为各种用例创建逼真的自定义音频。

主要功能

克隆用户声音

录制声音后,可按用户的声音风格或任意音频样本的风格生成语音。

文本描述生成人声

通过文本描述声音风格的特征及声学环境,生成对应的人声。

改变声音风格

结合声音和文本描述,可修改现有声音的风格。

文本描述生成音效

根据输入的声音特征和文本描述,生成所需的声音效果。

噪音消除

利用Magic Eraser功能消除录音中的瞬态噪声。

声音填充

通过文本描述指定特征,用新生成的声音替换音频中的部分片段。

音频故事制作器

结合所有功能,使用Audiobox Maker创作原创且有趣的音频故事。