MOSS-TTS-Nano 是由 MOSI.AI 与 OpenMOSS 团队推出的开源轻量级多语言语音生成模型,专为实时 TTS 场景设计。模型仅有 0.1B 参数,可直接在 CPU 上运行,无需 GPU 即可完成流式语音生成,极大降低了部署门槛。其采用纯自回归 Audio Tokenizer + LLM 架构,在保持高生成效率的同时兼顾语音质量与部署简洁性,非常适合本地演示、Web 服务及轻量级产品集成。
核心功能:
⚡ 超小模型体积:仅 0.1B 参数,资源占用极低
💻 CPU 友好运行:支持 4 核 CPU 实时流式生成
🎙️ 48kHz 双声道输出:提供高质量原生音频
🌍 多语言支持:支持中文、英文等多种语言
🔄 流式推理:低延迟、快速首字节输出
📄 长文本支持:自动分块处理长文本输入
🧬 语音克隆能力:支持基础语音克隆/参考音色生成
应用场景:
🤖 本地 AI 语音助手 / Agent
🌐 Web 端实时语音播报
📱 轻量化 App / 嵌入式设备语音合成
🎮 游戏 NPC 实时配音
🎙️ 开发者 Demo / 原型验证

开源地址:https://github.com/OpenMOSS/MOSS-TTS-Nano

☞☞☞☞☞☞  一键启动包在右侧下载  ☞☞☞☞☞☞

配置要求:

电脑满足以下配置:

  • 操作系统:Windows 10/11 64位
  • 内存:16G以上
  • 整个包解压完约3.06G,要留足硬盘空间

 

如何查看显卡品牌型号和显存:

  • 打开任务管理器
  • 点击“性能”
  • 点击“GPU”
  • 右上角可以看到显卡型号,下方可以看到显存大小

 

使用教程:

① 打开下载页面(https://aiyy.info/moss-tts-nano/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件在文件包中,或者可以自己下载安装,下载地址:https://www.winrar.com.cn/

不要用Windows自带解压!!不要用360解压!!

注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错

② 双击“一键启动.bat”,稍等片刻会在浏览器中自动打开操作界面

③ 上传参考音频,然后输入需要合成的文本,点击“开始生成”即可,其他生成参数根据说明进行调整,或保持默认即可

④ 生成结果如下

生成过程中会自动边生成边播放,可能会出现播放卡顿的情况,等完整生成之后再播放即可正常播放。

如果不想边生成边播放,就在开始生成前关闭流式解码,或者增加初始播放延迟

点击生成结果右侧的三个点,然后点击下载按钮可以保存至指定文件夹

 

声明: ① 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考赞助计划。 ② 本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。