GitHub 上一个开源的多语言文档 OCR 工具包:Surya。
这是一个专注于文档的 OCR,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub: https:// 网页链接
未来还会支持具体文本识别以及表格和图像的检测。
https://weibo.com/5722964389/NBZEoA5OP
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。