Follow

推荐 GitHub 上一款能从任何文档中提取文本的开源工具:Kreuzberg。

支持 PDF、图像、Word 文档等各种文件格式,自动化提取文本,以便用于检索增强生成(RAG)。

GitHub: github.com/Goldziher/kreuzberg

使用简单,且对 GPU 无要求,并提供了一个统一的异步接口,更高效地提取。

:icon_weibo: weibo.com/5722964389/PemihxU47

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。