稳定音频工具(Stable-Audio-Tools)由 Stability AI 开发,稳定音频工具是一款开源的音频处理库,旨在为研究人员、开发者和音乐爱好者提供一套完整的音频预处理、分析、生成和转换工具。基于 Python 和 PyTorch,这个库使音频处理更加便捷和高效。
视频教程:
软件功能:
- 通过简单提示词生成各种音乐或者音效
应用场景:
- 人工智能研究:研究人员可以利用该库快速搭建实验环境,开展语音识别、情感分析和音乐生成等研究。
- 音频应用开发:开发者可以将工具集成到他们的应用程序中,如智能语音助手、音频编辑软件或在线音乐平台。
- 教育与学习:学生和初学者可以通过这个项目学习音频处理的基础知识和技术,并实践深度学习模型的应用。
配置要求:
建议电脑满足以下配置:
- 操作系统:Windows 10/11 64位
- 显卡:支持Ampere 架构的英伟达(NVIDIA)显卡(一般RTX 30系列及以上显卡支持)
如何查看显卡品牌型号和显存:
- 打开任务管理器
- 点击“性能”
- 点击“GPU”
- 右上角可以看到显卡型号,下方可以看到显存大小
使用教程:
① 打开下载页面(https://aiyy.info/stable-audio-tools/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件下载地址:https://www.winrar.com.cn/)
注意:文件夹路径和文件名称不要出现中文字符,否则部分软件会因识别不出而报错
② 20系及以上支持半精度的显卡双击“一键启动(半精度).exe”,运算速度更快, 其他不支持半精度的显卡双击“一键启动(单精度).exe”,稍等片刻会在浏览器中自动打开操作界面
③ 填写提示词,就是填写需要生成什么音效或者音乐(比如 Drumbeat 鼓点、The chirping of birds 鸟叫、The sound of rain 雨声等等),负面提示词填写不希望生成什么声音,可以先填noise噪音,避免生成噪音,调整生成音乐/音效的时长,目前软件最长支持生成47秒,最后点击生成即可
④ 生成结果位于右侧,可以试听,没什么问题就点击右上角下载按钮保存到指定文件夹