**GitHubDaily** @[email protected] · 2021-09-26T02:55:10Z

GitHubDaily @[email protected]

上个月，国外一家名为 Laion 的人工智能非盈利组织，开放了全球最大的图像文本对（image-text-pair）数据集，共提供了 4 亿样本数据。

数据来源于 Common Crawl 在 2014 - 2021 年间随机抓取的网页。元数据数据集基于 CC 4.0 许可开放。