国内一名开发者在 GitHub 开源了常用数据集:NLPDataSet。
主要将多个网络数据集进行整理清洗,并将格式统一化。其主要目的,在于构建一个较完善的中文片段抽取式阅读理解数据集。
GitHub:github.com/liucongg/NLPDataSet
https://weibo.com/5722964389/Ks9HQvfzg
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。