Follow

推荐 GitHub 上一个基于 FastAPI 的 PDF 文档提取和解析工具:pdf-extract-api。

使用最新的 OCR 技术和 Ollama 模型进行处理,可将任何图像或 PDF 文件转换为 Markdown 文本或结构化的 JSON 文档。

GitHub: github.com/CatchTheTornado/pdf

支持处理表格数据、数字或数学公式等格式,并使用 Redis 存储和缓存 OCR 结果,以提高效率。

:icon_weibo: weibo.com/5722964389/OES7rAt81

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。