小红书推出的 FireRedTTS 是一款创新的 AI 语音合成工具,只需几秒参考音频,便能克隆声音并生成各种风格的个性化语音。该工具不仅无需复杂的训练,还能模仿多种音色,适用于短视频配音、聊天软件等场景,让用户轻松打造独特的声音效果。
开源地址:https://github.com/FireRedTeam/FireRedTTS
☞☞☞☞☞☞ 右侧下载整合包 ☞☞☞☞☞☞
原音频:
克隆后生成:
软件功能
- 多音色模仿:FireRedTTS 可以模仿从萝莉音、御姐音到磁性大叔音等多种音色,满足不同用户的需求。
- 无需训练:用户只需提供几秒钟的参考音频,FireRedTTS 即可生成个性化的语音,无需复杂的训练过程。
- 风格多变:无论是搞笑、温柔,还是霸气的风格,FireRedTTS 都能轻松实现,适用于多种场景和情感需求。
- 快速生成:只需几秒钟参考音频,便能快速生成完整语音,极大提升了短视频创作效率。
应用场景
- 短视频配音:创作者可以通过 FireRedTTS 为短视频轻松配音,生成搞怪、温柔等不同风格的声音,让作品更加生动有趣。
- 聊天互动:用户可以在聊天软件中使用明星音色或个性化的语音进行交流,为日常对话增添趣味性和个性化。
- 广告和影视配音:FireRedTTS 提供了多种风格的声音合成,适用于广告、影视配音,能够快速为作品注入独特的声音效果。
- 音频创作:音乐和播客创作者可以使用 FireRedTTS 生成多种风格的语音,为音频作品增添新的声音元素。
配置要求:
建议电脑满足以下配置:
- 操作系统:Windows 10/11 64位
- 显卡:建议8G显存及以上的英伟达(NVIDIA)显卡,
- CUDA >= 11.8
- 整个包解压完约12.6G,要留足硬盘空间
CUDA如未安装可以查看安装教程:https://aiyy.info/requirements/
如何查看显卡品牌型号和显存:
- 打开任务管理器
- 点击“性能”
- 点击“GPU”
- 右上角可以看到显卡型号,下方可以看到显存大小
使用教程:
① 打开下载页面(https://aiyy.info/fireredtts/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件下载地址:https://www.winrar.com.cn/)
注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错
② 音频素材只需几秒即可,先处理音频,素材声音建议为干声(无背景音、无杂音),效果较佳,如果音频有背景音或者伴奏可以先用UVR处理一下
UVR使用教程及下载链接:https://aiyy.info/uvr5/
另外,需要删除掉素材音频中的大于1秒的停顿/静音部分,文件包中自带一个简单的处理工具,可以自动剪切掉音频中的停顿/静音部分。将音频文件放入“input_process”文件夹,双击“音频处理.exe”
处理完毕后关闭此程序窗口
处理完毕的音频位于“output_process”文件夹
③ 双击“一键启动.exe”,稍等片刻会在浏览器中自动打开操作界面
④ 上传处理好的音频,再输入要生成的文本,选择语言(“zh”为中文,“en”为英文,注意此处一定要选,即使已经是所需要的选项也要打开选一下,否则会报错),最后点击“Submit”提交,稍等片刻就会生成结果,生成结果位于右侧
⑤ 点击生成结果右上角的下载按钮即可保存至指定文件夹
原音频:
生成结果: