Follow

平时在处理论文、报告、产品文档这类资料时,为了找到特定信息往往需要逐页查找,或者依赖传统搜索工具,特别是处理大量文档时更是耗时又费力。

面对这一困境,Kotaemon 这个开源项目让我们能直接与文档进行对话,通过聊天方式即可提取所需的各种信息,彻底改变了我们与文档交互的方式!

它采用混合检索技术结合大语言模型,在提供答案的同时还会附上详细引用和文档预览,支持表格和图片识别,甚至能够处理复杂推理需求,让检索体验更精准高效。

GitHub: github.com/Cinnamon/kotaemon

主要功能:

- 支持多用户登录,可将文件整理成私人/公共集合并分享

- 兼容流行的 API 服务商和本地 LLM 模型,保护隐私数据

- 多模态文档解析,支持提取图表和表格中的信息

- 高级引用系统,在浏览器中直接预览原文并高亮相关内容

- 复杂推理支持,能够处理多步骤问题和复杂查询

- 可定制设置界面,允许调整检索和生成过程的关键参数

只需通过 Docker 或 Python 环境安装即可使用,支持本地部署保护敏感数据。

:icon_weibo: weibo.com/5722964389/Pq8IAsPhl

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。