请先查看下方配置要求,确认电脑能使用再下载,如果不知道什么是网盘、什么是压缩包以及什么是电脑配置,请勿下载

MarkItDown 是一款轻量级 Python 文档转换工具,专为 将各类文件转换为适合大语言模型处理的 Markdown 格式 而设计。它能够在转换过程中尽可能保留原始文档的重要结构信息,如标题、列表、表格、链接等,相比传统文本提取工具更适合用于 LLM、RAG、知识库构建和文本分析流程。虽然输出结果也具备较好的可读性,但其核心定位是为机器理解优化,而非高保真排版还原。
支持格式广泛,包括:
📄 PDF
📊 PowerPoint / Excel / Word
🌐 HTML / YouTube URL / EPUB
📁 CSV / JSON / XML / 等文本或压缩格式
应用场景:
🤖 构建 AI 知识库 / RAG 文档库
📚 批量整理多格式资料供 LLM 使用
🔍 文档解析与结构化文本提取
🧠 AI Agent / 搜索系统的数据预处理
开源地址:https://github.com/microsoft/markitdown
☞☞☞☞☞☞ 一键启动包在右侧下载 ☞☞☞☞☞☞
配置要求:
电脑满足以下配置:
- 操作系统:Windows 10/11 64位
- 内存:8G以上
- 整个包解压完约908M,要留足硬盘空间
如何查看显卡品牌型号和显存:
- 打开任务管理器
- 点击“性能”
- 点击“GPU”
- 右上角可以看到显卡型号,下方可以看到显存大小

使用教程:
① 打开下载页面(https://aiyy.info/markitdown/)点击页面右侧下载按钮(手机端在页面底部),下载整合包之后解压,建议使用winrar解压(解压软件在文件包中,或者可以自己下载安装,下载地址:https://www.winrar.com.cn/)
不要用Windows自带解压!!不要用360解压!!

注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错

② 双击“一键启动.bat”,稍等片刻会在浏览器中自动打开操作界面

③ 在页面中选择“单文件转换”或者“批量转换”,然后上传文件,点击“开始转换”即可

结果如下图所示
在文件包中的“outputs”文件夹中可以找到处理结果

