**GitHubDaily** @[email protected] · 2024-11-05T10:10:11Z

GitHubDaily @[email protected]

推荐 GitHub 上一个基于 FastAPI 的 PDF 文档提取和解析工具：pdf-extract-api。

使用最新的 OCR 技术和 Ollama 模型进行处理，可将任何图像或 PDF 文件转换为 Markdown 文本或结构化的 JSON 文档。

支持处理表格数据、数字或数学公式等格式，并使用 Redis 存储和缓存 OCR 结果，以提高效率。