Follow

推荐 GitHub 上一个专门用于识别和提取表格的 OCR 小工具:Tabled。

基于 Surya 开发,能够查找 PDF 文件中所有的表格,识别表格中的行与列内容,并提取转换为 Markdown、CSV 或 HTML 文件。

GitHub: github.com/VikParuchuri/tabled

此外,还支持图像、Word 文档 以及 PPT 等文件中表格的识别,提供了快速可托管的 API 使用。

:icon_weibo: weibo.com/5722964389/OChP4iiej

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。