Follow

传统 PDF 转 Markdown 工具常因无法精确理解文档内容而导致结构混乱、格式丢失,让人不得不手动修改。

今天分享 GitHub 上一款基于多模态大语言模型的 PDF 转 Markdown 工具:MarkPDFDown。

它能通过 AI 理解文档结构,智能保留标题、列表、表格等复杂排版元素,轻松实现高质量的文档结构化转换。

GitHub: github.com/jorben/markpdfdown

主要功能:

- 支持任意 PDF 文档的格式转换

- 利用多模态 AI 技术理解文档结构和内容

- 完整保留表格、公式等复杂排版元素

- 支持自定义 AI 模型参数配置

- 支持指定页码范围进行转换

同时提供了 Docker 快速部署方式,不过需要配置 OpenAI API 密钥使用。

:icon_weibo: weibo.com/5722964389/PiY3PuWm5

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。