EchoMimic_V2：图片生成说话数字人（更新V2加速版）

2025-01-05 AI一键启动包 AI数字人启动包 2 1 11.4K

详情介绍
常见问题

注意：私人打包的程序没给杀毒软件交过保护费，被误报毒很正常，介意请勿下

EchoMimic是阿里巴巴达摩院开发的一项AI技术，能够通过给定的音频和一张面部照片，生成与音频口型动作完美匹配的说话视频。该技术在娱乐、教育、虚拟现实和在线会议等领域有广泛应用前景。

2024.11.24更新EchoMimic_V2版本，支持上传半身图片，生成半身数字人

2024.1.5更新EchoMimic_V2版本加速版，推理速度提升约9倍

开源地址（V1版本）：https://github.com/BadToBest/EchoMimic

开源地址（V2版本）：https://github.com/antgroup/echomimic_v2

☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞

视频介绍（V2-加速版）：

视频介绍（V2）：

视频介绍（V1）：

软件功能：

口型同步生成：通过音频和面部照片，生成口型动作与语音完美匹配的视频。
自然逼真：融合音频和面部标志点特征，生成的面部动画符合真实面部运动和表情变化。
多语言支持：支持多种语言和风格的口型同步，包括普通话、英语和歌唱。

应用场景：

娱乐：生成电影、电视和游戏中的角色对话，增强观众体验。
教育：创建互动教学视频，提高学习效果。
虚拟现实：在VR环境中生成逼真的面部动画，提升用户沉浸感。
在线会议：生成与音频同步的口型动画，提高远程交流效果。
增强现实：在AR应用中生成逼真的面部动画，增强用户互动体验。

配置要求：

电脑满足以下配置：

操作系统：Windows 10/11 64位
显卡：V1版本至少8G显存的英伟达（NVIDIA）显卡，V2版本至少12G显存的英伟达（NVIDIA）显卡可运行，稳定运行建议16G及以上，显卡性能越高生成速度越快
CUDA >= 12.4
整个包解压完约29.7G，要留足硬盘空间

电脑如未安装CUDA可以查看安装教程：https://aiyy.info/requirements/

如何查看显卡品牌型号和显存：

打开任务管理器
点击“性能”
点击“GPU”
右上角可以看到显卡型号，下方可以看到显存大小

使用教程：

① 打开下载页面（https://aiyy.info/echomimic/‎）点击页面右侧下载按钮，下载整合包之后解压，建议使用winrar解压（解压软件在文件包中，或者可以自己下载安装，下载地址：https://www.winrar.com.cn/）

不要用Windows自带解压！！不要用360解压！！

注意：文件夹路径和文件名称（包括音频、图片、视频等文件名称）不要出现中文字符，否则部分软件会因识别不出而报错

V2版本（加速版）使用教程：

② 双击“一键启动（加速版）.bat”，稍等片刻会在浏览器中自动打开操作界面

③ 上传图片，上传音频，点击开始生成，生成结果会位于右侧，生成速度参考：4060ti 16G 生成6秒视频需要3分12秒左右（原版需要36分12秒）

上传图片的素材要求人形正脸，五官清晰可见，可参考本页面底部官方案例

音频需要纯人声，如果有背景音，建议先用剪映或者UVR5等工具先把背景音乐去掉（人声/背景音分离工具UVR使用教程及下载链接：https://aiyy.info/uvr5/）

图片、音频等文件名称以及文件夹路径不要有中文！！！

图片需为1:1比例正方形，否则会压缩变形，人形正脸，五官清晰可见，人物半身照，手指露出，参考示例

④ 可以播放查看，点击右上角下载按钮可以保存至指定文件夹

速度比较：4060ti 16G 生成6秒视频加速版需要3分12秒左右（原版需要36分21秒）

V2版本使用教程：

② 双击“一键启动.exe”，稍等片刻会在浏览器中自动打开操作界面

③ 上传图片，上传音频，点击开始生成，生成结果会位于右侧，生成速度取决于显卡性能，可能时间会比较长，请耐心等待（生成速度参考：4060ti 16G 采样步数30的情况下，生成1秒需要5分钟左右）

上传图片的素材要求人形正脸，五官清晰可见，可参考下方示例案例

音频需要纯人声，如果有背景音，建议先用剪映或者UVR5等工具先把背景音乐去掉（人声/背景音分离工具UVR使用教程及下载链接：https://aiyy.info/uvr5/）

图片、音频等文件名称以及文件夹路径不要有中文！！！

图片需为1:1比例正方形，否则会压缩变形，人形正脸，五官清晰可见，人物半身照，手指露出，参考示例

④ 可以播放查看，点击右上角下载按钮可以保存至指定文件夹

V1版本使用教程

② 双击“一键启动.exe”，稍等片刻会在浏览器中自动打开操作界面

③ 上传图片，上传音频，可以调整参数（软件默认生成1200帧也就是50秒以内视频，高于50秒需要自行调节视频长度，视频长度=视频秒数×帧速率，最大长度5000帧）或保持默认，点击提交，生成结果会位于右侧

上传图片的素材要求人形正脸，五官清晰可见，可参考本页面底部官方案例

音频需要纯人声，如果有背景音，建议先用剪映或者UVR5等工具先把背景音乐去掉

图片、音频等文件名称以及文件夹路径不要有中文！！！

图片、音频等文件名称以及文件夹路径不要有中文！！！

图片、音频等文件名称以及文件夹路径不要有中文！！！

④ 可以播放查看，点击右上角下载按钮可以保存至指定文件夹

官方案例展示：

声明： ① 本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考赞助计划。 ② 本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

图片生成数字人图片说话数字人

免费下载或者专属资源能否直接商用？

本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考赞助计划。
提示下载完但解压或打开不了？

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量，若小于网盘提示的容量则是这个原因。不要用Windows系统自带解压，不要用360解压，建议用winrar进行解压（下载地址：https://www.winrar.com.cn/）。软件或迅雷下载。若排除这种情况，可在对应资源底部留言，或联络我们。
找不到素材资源介绍文章里的示例图片？

对于赞助方专享、整站源码、程序插件、网站模板、网页模版等类型的素材，文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买，且本站不负责(也没有办法)找到出处。同样地一些字体文件也是这种情况，但部分素材会在素材包内有一份字体下载链接清单。
消耗积分后无法显示下载地址或者无法查看内容？

如果您已经消耗积分但是网站没有弹出成功提示，请联系站长提供积分消耗信息为您处理
消耗积分获取该资源后，可以退款吗？

本站资源属于虚拟商品，具有可复制性，可传播性，一旦授予，不接受任何形式的退款、换货要求。请您在支付获取之前确认好是您所需要的资源

下载

本资源需权限下载

10积分

路过玩家: 10积分
赞助大哥: 免费
赞助大佬: 免费

包含资源: (8个)
最近更新: 2025-06-05

购买提示

含百度、夸克网盘下载链接

有效期：永久有效

不要用Windows系统自带解压、不要用360解压，建议用WinRAR解压

📣 建议登录账号再兑换下载，可以享受资源永久免费更新

📣 虚拟物品一经下载恕不退换，兑换前请先确认电脑配置是否满足使用要求

📣 下载遇到问题？可联系客服或反馈