Follow

推荐 GitHub 上一款强大的 PDF 文档分析开源工具:PDF Document Layout Analysis。

它能准确自动识别 PDF 页面中的文本、标题、图片、表格等元素,并确定它们的正确阅读顺序,大幅提升文档处理效率。

GitHub: github.com/huridocs/pdf-docume

主要功能:

- 高精度自动识别文档中的 11 种常见不同元素类型,如标题、图片、表格等;

- 提供高性能视觉模型和快速轻量级模型两种选择;

- 支持表格提取为 Markdown、LaTeX 或 HTML 格式;

- 支持公式提取为 LaTeX 格式;

- 通过 Tesseract OCR 支持 150+ 种语言的文本识别。

使用 Docker 快速部署,支持 GPU 加速,几行命令即可启动服务并开始分析 PDF 文档。

:icon_weibo: weibo.com/5722964389/PmsTfAX62

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。