分享 GitHub 上一款强大的开源文档 OCR 工具:olmOCR,专为高精度转换 PDF 和其他文档为纯文本而设计。
该工具能完美保留文档原始阅读顺序,支持表格、公式、手写内容识别,特别适合处理学术论文和技术文档。
GitHub: https://github.com/allenai/olmocr
主要特性:
- 高吞吐量文档处理能力
- 保留自然阅读顺序的文本转换
- 支持表格、公式和手写内容识别
- 针对学术论文和技术文档优化
- 独特提示技术提高准确率并减少幻觉
- 可部署于自有 GPU 实现高效文档处理