分享一个端到端的开源 OCR 模型,号称 OCR 2.0!
支持场景文本、文档、乐谱、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
GitHub: https://github.com/Ucas-HaoranWei/GOT-OCR2.0
模型下载:huggingface.co/ucaslcl/GOT-OCR2_0
从给出的演示图来看,一些非常复杂的数学公式都能正确的识别,颇为强大。
模型大小仅 1.43GB,感兴趣的可以试试。
https://weibo.com/5722964389/OxgIFBROC
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。