推荐 GitHub 上一个专门用于识别和提取表格的 OCR 小工具:Tabled。
基于 Surya 开发,能够查找 PDF 文件中所有的表格,识别表格中的行与列内容,并提取转换为 Markdown、CSV 或 HTML 文件。
GitHub: https://github.com/VikParuchuri/tabled
此外,还支持图像、Word 文档 以及 PPT 等文件中表格的识别,提供了快速可托管的 API 使用。
#AI创造营
https://weibo.com/5722964389/OChP4iiej
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。