请先查看下方配置要求,确认电脑能使用再下载,如果不知道什么是网盘、什么是压缩包以及什么是电脑配置,请勿下载

ACE-Step v1.5 是一款高效开源的音乐生成基础模型,在保持极低硬件门槛的同时,实现了接近甚至超越多数商业模型的生成质量。它可在消费级显卡机器上本地运行,并在性能上表现惊人。该模型基于创新的“语言模型 + 扩散变换器(DiT)”混合架构,由语言模型负责规划完整音乐结构(包括旋律、歌词、元数据等),再由扩散模型完成高质量音频生成,同时通过内在强化学习实现高一致性与低偏差输出。
核心功能:
- ⚡ 超高速生成:数分钟内生成完整歌曲
- 🎵 高质量输出:达到商业级水准,接近主流付费模型
- ⏱️ 灵活时长控制:支持 10 秒至 10 分钟音频生成
- 🌍 多语言歌词支持:支持 50+ 语言,结构与风格可控
- 🎨 风格精细控制:支持 1000+ 乐器与风格描述
- 🧩 轻量个性化(LoRA):用少量歌曲即可训练专属风格模型
- ✂️ 多种编辑能力:支持翻唱、重绘、语音转伴奏等操作
应用场景:
- 🎼 音乐创作与灵感生成
- 🎬 视频 / 短视频配乐
- 🎮 游戏音效与背景音乐制作
- 🎙️ AI 音乐人 / 虚拟歌手
- 📱 内容创作与商业音乐生产
开源地址(1.0版本):https://github.com/ace-step/ACE-Step
开源地址(1.5版本):https://github.com/ace-step/ACE-Step-1.5
☞☞☞☞☞☞ 右侧下载整合包 ☞☞☞☞☞☞
视频介绍(1.0版本):
配置要求:
电脑需满足以下配置:
- 操作系统:Windows 10/11 64位
- 内存:建议20G以上
- 显卡:至少8G及以上显存的英伟达(NVIDIA)显卡
- CUDA:显卡支持的CUDA版本大于等于12.8版本(如不知道显卡支持的CUDA版本,可点击此链接查看:https://aiyy.info/supported-cuda-versions/)
- 整个包解压完约18.1G,要留足硬盘空间
如何查看显卡品牌型号和显存:
- 打开任务管理器
- 点击“性能”
- 点击“GPU”
- 右上角可以看到显卡型号,下方可以看到显存大小

使用教程:
① 打开下载页面(https://aiyy.info/ace-step/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件在文件包中,或者可以自己下载安装,下载地址:https://www.winrar.com.cn/)
不要用Windows自带解压!!不要用360解压!!

注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错

② 双击“一键启动.bat”,稍等片刻会在浏览器中自动打开操作界面

1.5版本
③ 程序会自动检测显卡性能,根据自动检测的显存选择GPU层级,然后点击“初始化服务”,程序会自动下载适合你显卡的模型文件

④ 初始化完成后,下拉操作界面,选择生成模式(比如custom定制模式),可以上传参考音频(也可以不上传),然后输入音乐描述和歌词,也可以直接点击右侧的“试试看”会自动填充示例作为测试,最后点击“生成音乐”

⑤ 等待生成完毕,生成结果如下图所示

可以播放试听,点击“保存”可以保存至指定文件夹

1.0版本
③ 可以调节音频时长(默认的-1为随机时长),然后输入音乐标签提示词(也可以启用音频参考,上传参考音频用于生成,不过测试效果不好,就不推荐了),再输入歌词(可以用[verse](主歌)、[chorus](副歌)和[bridge](过渡段)来分隔歌词的不同部分),最后点击“生成”,生成结果位于右侧,可以播放时长,点击右上角下载按钮可以保存至指定文件夹,如不满意也可以重新生成

生成结果:
在文件包中的“outputs”文件夹中也能找到生成结果

