请先查看下方配置要求,确认电脑能使用再下载

DeepSeek 发布了 Janus-Pro 多模态大模型,这是 JanusFlow 的高级版本,Janus-Pro 在 训练策略、数据规模 和 模型容量 方面进行了优化,实现了 更强的多模态理解能力,更稳定的图像生成,并在 GenEval 和 DPG-Bench 基准测试中超越 Stable Diffusion 和 DALL·E 3。

这里带来的是Janus-Pro的1B版本,对显存要求较低,可在消费级显卡上运行,文本生成图像效果有限,玩图片生成还是建议用flux等更优质的模型

2025.2.12更新:增加7B版本模型,对显卡要求比较高,多模态需要16G显存,文生图需要40G显存(含共享显存),有需要请下载“Janus-Pro-20250212.rar”

开源地址:https://github.com/deepseek-ai/Janus

☞☞☞☞☞☞  一键启动包在右侧下载  ☞☞☞☞☞☞

 

软件功能:

  • 图像理解:可以理解图像中的内容并回答相关问题
  • 文本到图像(Text-to-Image)生成:根据文本描述精准生成高质量图像,满足不同创意需求
  • 多模态理解与指令跟随:能够更准确地理解复杂提示词,提高文本与生成图像的一致性

 

配置要求:

电脑满足以下配置:

  • 操作系统:Windows 10/11 64位
  • 显卡:1B版本模型“多模态理解(图像问答)”需要至少8G显存的英伟达(NVIDIA)显卡,“文本生成图像”需要至少12G显存的英伟达(NVIDIA)显卡;7B版本模型“多模态理解(图像问答)”需要至少16G显存的英伟达(NVIDIA)显卡,“文本生成图像”需要约40G显存(含共享显存)
  • CUDA >= 12.4
  • 1B版本整个包解压完约12.6G,1B+7B版本将近30G,要留足硬盘空间

 

如何查看显卡品牌型号和显存:

  • 打开任务管理器
  • 点击“性能”
  • 点击“GPU”
  • 右上角可以看到显卡型号,下方可以看到显存大小

 

使用教程:

① 打开下载页面(https://aiyy.info/janus-pro/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件在文件包中,或者可以自己下载安装,下载地址:https://www.winrar.com.cn/

不要用Windows自带解压!!不要用360解压!!

注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错

② 双击“一键启动.bat”,稍等片刻会在浏览器中自动打开操作界面

③ 可以选择“多模态理解(图像问答)”或者“文本生成图像”

1、多模态理解(图像问答)

选择“多模态理解(图像问答)”,上传图片,然后输入问题,点击“开始对话”,程序就会理解图片内容并回答问题

2、文本生成图像

选择“文本生成图像”,输入提示词(建议使用英文提示词,效果更佳),再点击“生成图像”,生成结果位于下方

 

声明: ① 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考赞助计划。 ② 本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。