Follow

GitHub 上一款能将 PDF 转换为其他格式的开源工具:PDF craft。

专注于扫描书籍处理,能提取正文、过滤页眉页脚、处理跨页连接,可将 PDF 转为 Markdown 或带结构的 EPUB 电子书。

GitHub: github.com/oomol-lab/pdf-craft

主要功能:

- 使用本地 AI 模型将 PDF 转换为 Markdown 格式,无需联网

- 支持将 PDF 转换为带结构的 EPUB 电子书格式

- 智能识别并过滤页眉、页脚、脚注、页码等干扰元素

- 自动处理图表、公式,以图片形式保留在转换后的文件中

- 结合 LLM 技术构建书籍结构,生成带目录和章节的 EPUB

首次使用会自动下载所需 AI 模型,同时推荐配置使用 DeepSeek V3 模型。

:icon_weibo: weibo.com/5722964389/PjUMLbTEZ

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。