@nyancatflies @yisheng 英语国家也有,而且不少的。而且随着国内外隐私权,被遗忘权等概念普及,有内容发布者主观注销账户以保护隐私。或者因为非法内容,如版权等问题被查水表,被迫删除。
包括上面提到的 互联网档案馆,网站站长也可以禁止相关爬虫索引,已经收录的也可以发邮件联系彻底删除。
Pew Research Center 称,2013 年存在的页面中,38% 目前已无法访问。 文章还提到:
- 研究者取得的 50000 个英文维基百科条目中,82% 的条目有至少一个链接失效。
- 研究者于今年三月至四月取得的约 500 万条推文中,18% 的推文在三个月后已经无法公开访问,11% 的推文甚至连发送者账户都无法公开访问(被锁推、封禁或注销)。
@nyancatflies @yisheng 可能确实有不同,但是中英文内容都在消失。我上面内容也是补充了一下文中说法,比如半年可见原因。
就马云这个例子,按文中说法就可以解释,应该经济因素主导。服务器关闭失效。数据可能还在,有备份什么的,只是网上找不到了。
像新浪有个微博,公司还在,还能看到很老的新闻资讯。即使如此,其中一些链接也失效了。如果未来有某个软件取代了微博,新浪公司倒闭,服务器关闭后,中文互联网可能会消失很多内容。
今日头条除了相关软件,互联网也索引不到。一些公司,个人或组织发布的新闻资讯网站,公司倒闭,服务器关闭,就消失了。
审查因素来看,马云应该不至于。
---
这个版权内容在互联网上消失,实际效果和仅半年可见差不多呀。数据当然还在,只是看不到了。扩大一下概念,版权和著作权等等,影响范围很大。比如商业作品, NBA 直播版权,每年春晚视频,不允许转载的视频,不允许转载的文章,付费知识,付费小说,不允许分流的游戏模组等等。很多转载之后不是那么合法,或者符合公德。
此外非法内容,不止是版权,例如 pornhub 前几年就删除了不少视频。再有就是极端言论,例如纳粹相关内容。
数据也都在,只是搜索引擎搜不到,或者网络上找不到。
@kkbt @yisheng 我还是认为这两者也非常大的不同。首先马云的例子显然是指公共媒体信息,如新闻报道,而个人锁定乃至删除私人的社交媒体账号和个人博客是私人领域的行为。过去也有烧日记和手稿的,个人完全有权掌控关于私生活的信息。这和简中互联网大规模删除网络上的新闻报道是完全不同的。
而内容会被版权方查水表本身就意味着版权方在社会上属于强势和特权阶级,艺术内容的版权若在这些法人手中,本身就不易流失。这里唯一例外的是闭源软件,因其复杂程度需要长期有人维护,不像图像、音频和视频一旦完成就不用管了。但众所周知,abandonware也不是copyright strike滥用的典型对象。