GitHub 上一份整理了关于数据收集的开源实用工具和抓取数据列表:LLM Data Scrapers。
涵盖了从不同来源,如代码库、网页和 PDF 文档等,提取数据的多种方法,并将数据转换为 LLMs 可以处理的格式。
GitHub: https://github.com/patrickloeber/llm-data-scrapers
除此之外,还提供了相关的数据和更多的实用工具列表。
#AI创造营
https://weibo.com/5722964389/PfOfmlJHZ
Why is this step necessary? hello.2heng.xin might not be the server where you are registered, so we need to redirect you to your home server first. Don't have an account? You can sign up here
hello.2heng.xin