Audiobox:Meta的免费开源AI音频生成模型
Meta于2023年11月30日推出Audiobox,这是一款免费开源的AI语音和声音生成模型。该模型于12月11日上线在线网页版本,用户可免费体验其功能。作为Meta继Voicebox之后推出的最新一代音频生成模型,Audiobox能够结合语音输入和自然语言文本提示来生成语音和音效,从而让用户轻松为各种用例创建逼真的自定义音频。
主要功能
克隆用户声音
录制声音后,可按用户的声音风格或任意音频样本的风格生成语音。
文本描述生成人声
通过文本描述声音风格的特征及声学环境,生成对应的人声。
改变声音风格
结合声音和文本描述,可修改现有声音的风格。
文本描述生成音效
根据输入的声音特征和文本描述,生成所需的声音效果。
噪音消除
利用Magic Eraser功能消除录音中的瞬态噪声。
声音填充
通过文本描述指定特征,用新生成的声音替换音频中的部分片段。
音频故事制作器
结合所有功能,使用Audiobox Maker创作原创且有趣的音频故事。
本文最后更新于2025年09月05日,已经过了1天没有更新,若内容或图片失效,请留言反馈
免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。