**GitHubDaily** @[email protected] · 2025-02-26T23:30:18Z

GitHubDaily @[email protected]

分享 GitHub 上一款强大的开源文档 OCR 工具：olmOCR，专为高精度转换 PDF 和其他文档为纯文本而设计。

该工具能完美保留文档原始阅读顺序，支持表格、公式、手写内容识别，特别适合处理学术论文和技术文档。

主要特性：

- 高吞吐量文档处理能力

- 保留自然阅读顺序的文本转换

- 支持表格、公式和手写内容识别

- 针对学术论文和技术文档优化

- 独特提示技术提高准确率并减少幻觉

- 可部署于自有 GPU 实现高效文档处理