Janus Pro：图像理解&文生图像（更新7B版本）-AI应用帮

请先查看下方配置要求，确认电脑能使用再下载

DeepSeek 发布了 Janus-Pro 多模态大模型，这是 JanusFlow 的高级版本，Janus-Pro 在训练策略、数据规模和模型容量方面进行了优化，实现了更强的多模态理解能力，更稳定的图像生成，并在 GenEval 和 DPG-Bench 基准测试中超越 Stable Diffusion 和 DALL·E 3。

这里带来的是Janus-Pro的1B版本，对显存要求较低，可在消费级显卡上运行，文本生成图像效果有限，玩图片生成还是建议用flux等更优质的模型

2025.2.12更新：增加7B版本模型，对显卡要求比较高，多模态需要16G显存，文生图需要40G显存（含共享显存），有需要请下载“Janus-Pro-20250212.rar”

开源地址：https://github.com/deepseek-ai/Janus

☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞

软件功能：

图像理解：可以理解图像中的内容并回答相关问题
文本到图像（Text-to-Image）生成：根据文本描述精准生成高质量图像，满足不同创意需求
多模态理解与指令跟随：能够更准确地理解复杂提示词，提高文本与生成图像的一致性

配置要求：

电脑满足以下配置：

操作系统：Windows 10/11 64位
显卡：1B版本模型“多模态理解（图像问答）”需要至少8G显存的英伟达（NVIDIA）显卡，“文本生成图像”需要至少12G显存的英伟达（NVIDIA）显卡；7B版本模型“多模态理解（图像问答）”需要至少16G显存的英伟达（NVIDIA）显卡，“文本生成图像”需要约40G显存（含共享显存）
CUDA >= 12.4
1B版本整个包解压完约12.6G，1B+7B版本将近30G，要留足硬盘空间

如何查看显卡品牌型号和显存：

打开任务管理器
点击“性能”
点击“GPU”
右上角可以看到显卡型号，下方可以看到显存大小

使用教程：

① 打开下载页面（https://aiyy.info/janus-pro/）点击页面右侧下载按钮，下载整合包之后解压，建议使用winrar解压（解压软件在文件包中，或者可以自己下载安装，下载地址：https://www.winrar.com.cn/）

不要用Windows自带解压！！不要用360解压！！

注意：文件夹路径和文件名称（包括音频、图片、视频等文件名称）不要出现中文字符，否则部分软件会因识别不出而报错

② 双击“一键启动.bat”，稍等片刻会在浏览器中自动打开操作界面

③ 可以选择“多模态理解（图像问答）”或者“文本生成图像”

1、多模态理解（图像问答）

选择“多模态理解（图像问答）”，上传图片，然后输入问题，点击“开始对话”，程序就会理解图片内容并回答问题

2、文本生成图像

选择“文本生成图像”，输入提示词（建议使用英文提示词，效果更佳），再点击“生成图像”，生成结果位于下方

声明： ① 本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考赞助计划。 ② 本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Janus Pro：图像理解&文生图像（更新7B版本）

请先查看下方配置要求，确认电脑能使用再下载

☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞

软件功能：

配置要求：

使用教程：

相关文章

Artist：一键生成风格化图像

LatentSync: 根据音频生成对嘴型视频（更新1.6版本模型）

MV-Adapter：单张图生成多视角图像

MuseTalk：唇形同步数字人（更新1.5版本）

近期文章