Follow

上个月,国外一家名为 Laion 的人工智能非盈利组织,开放了全球最大的图像文本对(image-text-pair)数据集,共提供了 4 亿样本数据。

数据来源于 Common Crawl 在 2014 - 2021 年间随机抓取的网页。元数据数据集基于 CC 4.0 许可开放。

地址: 网页链接

:icon_weibo: weibo.com/5722964389/KzUvaisxB

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。