研究发现2013年的网页有38%当前已无法访问
皮尤研究中心当地时间17日发表的研究发现,当前的在线内容仍然是“稍纵即逝”。
研究人员从Common Crawl的档案中随机抽样收集了大约100万个网页,从2013年到2023年,每年从Common Crawl收录的网页中抽取样本,并检查这些样本在当下是否仍然存在。
数据显示,在2013年存在的网页中,约有38%如今已不可用,而在2023年存在的网页中,这一比例仅为8%。
在我们从2013年到2023年收集的所有网页中,有25%到2023年10月已无法访问。这些网页无法访问的结果包含两种不同情况:16%的页面是网页不在域名还在;另外9%的页面则是连域名都不在了。
研究人员从Common Crawl的档案中随机抽样收集了大约100万个网页,从2013年到2023年,每年从Common Crawl收录的网页中抽取样本,并检查这些样本在当下是否仍然存在。
数据显示,在2013年存在的网页中,约有38%如今已不可用,而在2023年存在的网页中,这一比例仅为8%。
在我们从2013年到2023年收集的所有网页中,有25%到2023年10月已无法访问。这些网页无法访问的结果包含两种不同情况:16%的页面是网页不在域名还在;另外9%的页面则是连域名都不在了。