Follow

一个基于 LLM 的 OCR 扫描 PDF 开源工具 LLM-Aided OCR。

旨在通过利用多模态大语言模型(LLM)将原始的 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。

GitHub: github.com/Dicklesworthstone/l

首先将 PDF 文件转图像,进行 OCR 扫描处理提取文本,再利用本地 LLM 或 API(如 OpenAI、Anthropic)纠正 OCR 错误,最后转换成高准确度、高质量的 Markdown 文本。

:icon_weibo: weibo.com/5722964389/OsRkgr9JW

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。