Follow

推荐 GitHub 上一个能帮你将数据清理及结构化的开源工具 OmniParse。

该工具能够将各种非结构化数据转化为结构化的、可操作的数据,方便用于检索增强生成(RAG)和微调。

无论是文档、表格、图像、视频、音频还是网页,都能将它们清理干净并结构化。

GitHub: github.com/adithya-s-k/omnipar

:icon_weibo: weibo.com/5722964389/Olh8vj7To

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。