MOSS-TTS-Nano：轻量声音克隆与语音合成-AI应用帮

请先查看下方配置要求，确认电脑能使用再下载，如果不知道什么是网盘、什么是压缩包以及什么是电脑配置，请勿下载

MOSS-TTS-Nano 是由 MOSI.AI 与 OpenMOSS 团队推出的开源轻量级多语言语音生成模型，专为实时 TTS 场景设计。模型仅有 0.1B 参数，可直接在 CPU 上运行，无需 GPU 即可完成流式语音生成，极大降低了部署门槛。其采用纯自回归 Audio Tokenizer + LLM 架构，在保持高生成效率的同时兼顾语音质量与部署简洁性，非常适合本地演示、Web 服务及轻量级产品集成。
核心功能：
⚡ 超小模型体积：仅 0.1B 参数，资源占用极低
💻 CPU 友好运行：支持 4 核 CPU 实时流式生成
🎙️ 48kHz 双声道输出：提供高质量原生音频
🌍 多语言支持：支持中文、英文等多种语言
🔄 流式推理：低延迟、快速首字节输出
📄 长文本支持：自动分块处理长文本输入
🧬 语音克隆能力：支持基础语音克隆/参考音色生成
应用场景：
🤖 本地 AI 语音助手 / Agent
🌐 Web 端实时语音播报
📱 轻量化 App / 嵌入式设备语音合成
🎮 游戏 NPC 实时配音
🎙️ 开发者 Demo / 原型验证

开源地址：https://github.com/OpenMOSS/MOSS-TTS-Nano

☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞

配置要求：

电脑满足以下配置：

操作系统：Windows 10/11 64位
内存：16G以上
整个包解压完约3.06G，要留足硬盘空间

如何查看显卡品牌型号和显存：

打开任务管理器
点击“性能”
点击“GPU”
右上角可以看到显卡型号，下方可以看到显存大小

使用教程：

① 打开下载页面（https://aiyy.info/moss-tts-nano/）点击页面右侧下载按钮，下载整合包之后解压，建议使用winrar解压（解压软件在文件包中，或者可以自己下载安装，下载地址：https://www.winrar.com.cn/）

不要用Windows自带解压！！不要用360解压！！

注意：文件夹路径和文件名称（包括音频、图片、视频等文件名称）不要出现中文字符，否则部分软件会因识别不出而报错

② 双击“一键启动.bat”，稍等片刻会在浏览器中自动打开操作界面

③ 上传参考音频，然后输入需要合成的文本，点击“开始生成”即可，其他生成参数根据说明进行调整，或保持默认即可

④ 生成结果如下

生成过程中会自动边生成边播放，可能会出现播放卡顿的情况，等完整生成之后再播放即可正常播放。

如果不想边生成边播放，就在开始生成前关闭流式解码，或者增加初始播放延迟

点击生成结果右侧的三个点，然后点击下载按钮可以保存至指定文件夹

声明： ① 本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考赞助计划。 ② 本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

MOSS-TTS-Nano：轻量声音克隆与语音合成

请先查看下方配置要求，确认电脑能使用再下载，如果不知道什么是网盘、什么是压缩包以及什么是电脑配置，请勿下载

☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞

配置要求：

使用教程：

相关文章

EasyAnimate: AI视频生成

Video-Background-Removal：视频抠图换背景

Stable Fast 3D：单张图片快速生成3D模型

Faster-Qwen3-TTS：快速声音克隆与语音合成

近期文章