Follow

GitHub 上一份整理了关于数据收集的开源实用工具和抓取数据列表:LLM Data Scrapers。

涵盖了从不同来源,如代码库、网页和 PDF 文档等,提取数据的多种方法,并将数据转换为 LLMs 可以处理的格式。

GitHub: github.com/patrickloeber/llm-d

除此之外,还提供了相关的数据和更多的实用工具列表。

:icon_weibo: weibo.com/5722964389/PfOfmlJHZ

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。