**GitHubDaily** @[email protected] · 2024-09-16T10:00:24Z

GitHubDaily @[email protected]

分享一个端到端的开源 OCR 模型，号称 OCR 2.0！

支持场景文本、文档、乐谱、图表、数学公式等内容识别，拿到了 BLEU 0.972 高分。

模型下载：huggingface.co/ucaslcl/GOT-OCR2_0

从给出的演示图来看，一些非常复杂的数学公式都能正确的识别，颇为强大。

模型大小仅 1.43GB，感兴趣的可以试试。