为什么早期的互联网所剩无几

2020-08-06 05:16:51

互联网诞生近五年后,才有人齐心协力将其存档。我们最早的许多在线活动已经消失了。

这位20岁的年轻人正在玩弄着支付迫在眉睫的三年制商科学位的想法;图已经在担心他的透支会如雨后春笋般涌现。于是他在便签簿上草草写下:“如何成为百万富翁。”

图建立了一个名为百万美元主页的网站。该网站的模型几乎简单得令人发指:上面有100万像素的广告空间,可供购买的像素为100块,每像素1美元。一旦你买了它们,它们就永远是你的了。当第一百万个像素售出时,图就成了百万富翁。至少,这是我们的计划。

百万美元主页于2005年8月26日推出,当时Tew花了50欧元注册域名和设置主机。广告商购买了像素,并提供了一个链接、小图像和少量文本,用于当光标悬停在他们的图像上时使用。

仅仅一个多月后,多亏了口碑和不断增加的媒体关注,Tew的主页已经筹集了超过25万美元(14万GB)。2006年1月,最后1000个像素在拍卖会上以38100美元(GB 21500)的价格售出;图确实赚了一百万。

百万美元主页在创建近15年后仍然在线。许多客户-包括英国的泰晤士报、旅游服务公司Cheapflights.com、在线门户网站雅虎!和摇滚二人组Tensiious D-已经有了15年的广告收入,而这笔一次性的费用。该网站每天仍有几千名观众;这可能是一笔非常好的投资。

图现在运营着冥想和正念应用平静,他确实成为了百万富翁。但他创建的主页也变成了其他东西:一个活的互联网时代的博物馆。15年可能看起来不是很长的时间,但就互联网而言,它就像一个地质时代。百万像素主页上约40%的链接现在链接到死网站。其他许多人现在指向全新的域名,他们原来的URL卖给了新的所有者。

百万美元的主页表明,互联网早期的衰败几乎是看不见的。在线下世界,比方说,一家地方报纸的关闭经常被广泛报道。但是,在线网站通常会在没有大张旗鼓的情况下消亡,你可能会有的第一个暗示是,当你点击一个链接,看到一个空白页面时,它们就不再存在了。

大约十年前,我花了两年时间在一个摇滚乐博客和美国在线(AOL)的音乐板块工作,AOL是一家庞大的互联网先驱,现在归美国电话公司Verizon所有。我编辑或撰写了数百篇现场评论、音乐新闻故事、艺术家采访和词条。Facebook和Twitter已经是巨大的受众推动力,智能手机让我们在工作和家庭之间连接到网络;网上冲浪已经成为一项全天候的活动。

你可以相当合理地假设,如果我需要证明我在那里的时间,只需在谷歌上搜索一下即可。但你就大错特错了。2013年4月,AOL突然关闭了其所有音乐网站-以及数十名编辑和数百名撰稿人多年来的集体工作。除了互联网档案馆(Internet Archive)保存的几篇文章外,几乎没有留下什么。互联网档案馆是一家总部位于旧金山的非营利性基金会,由计算机工程师布鲁斯特·卡勒(Brewster Kahle)于20世纪90年代末建立。

它是世界上众多组织中最突出的一个,这些组织试图在人类互联网完全消失之前拯救人类互联网存在的第一个十年的一些最后遗迹。

南安普顿大学(University Of Southampton)网络科学研究所(Web Science Institute)执行主任温迪·霍尔爵士(Dame Wendy Hall)对档案馆的工作毫不含糊:“如果没有他们,我们就不会有”早期材料,她说。“如果布鲁斯特·卡勒没有建立互联网档案馆并开始保存东西--没有等待任何人的许可--我们就会失去一切。”

温迪夫人说,档案馆和国家图书馆有保存书籍、报纸和期刊的经验,因为印刷品已经存在了很长时间。但互联网的到来-以及它以多快的速度成为一种大众交流和表达形式-可能让他们大吃一惊。自那以后,对互联网存档的尝试在许多领域一直在迎头赶上。“大英图书馆必须出版当地每份报纸的副本,”她说。随着报纸从印刷到网络,存档的形式也不同了。这些网站是否像它们之前的报纸一样是一种重要的资源?

当出版物关闭或与其他报纸合并时,报纸档案也很容易丢失。“我想,大多数报纸都会有某种分类或档案馆,”她说。“但除非存档得当,否则这些信息可能会丢失。”

试图将互联网存档的一个主要问题是,它从来都不会静止不动。每一分钟-每一秒-更多的照片、博客帖子、视频、新闻故事和评论都会被添加到这堆东西中。虽然数字存储的价格已经大幅下降,但归档所有这些材料仍然需要花钱。“谁来付钱呢?”温迪夫人问道。“我们生产的材料比过去多得多。”

在英国,数字保护的角色已经部分落到了大英图书馆的肩上。该图书馆运营着英国网络档案馆(UK Web Archive),该档案馆自2004年以来一直在获得许可的情况下收集网站。档案馆的项目经理杰森·韦伯(Jason Webber)表示,问题比大多数人意识到的要大得多。

“这不仅仅是早期的材料。大部分互联网没有存储起来,“他说。

“互联网档案馆在1996年首次开设档案页面。这是在第一个网页建立五年后。那个时代的任何东西都不是从现场直播的网络上抄袭过来的。“。即使是1991年建立的第一个网页也不复存在了;你可以在万维网联盟上看到的网页是一年后的复制品。

在网络问世的头五年里,英国发布的大部分材料都以.ac.uk-学者撰写的学术文章-结尾。直到1996年,随着商业网站的数量开始超过学术网站,网络才开始看到更多的通用网站被建立起来。

大英图书馆每年都会进行一次“域名爬行”--保存所有在英国出版的内容。“我们试着什么都买,但我们一年只做一次。但很多这样的网站的上限是500MB;这涵盖了很多较小的网站,但你只需要在那里放几个视频,而且很快就会达到这个上限。“。然而,像BBC新闻这样的新闻网站确实被爬行得更频繁。韦伯说,图书馆试图尽可能完整地了解英国退欧、2012年伦敦奥运会和第一次世界大战100周年等事件。

韦伯说:“我认为人们对缺少任何东西的意识非常低。”“数字世界是转瞬即逝的,我们看着我们的手机,上面的东西发生了变化,我们并没有真正去想它。但现在人们越来越意识到我们可能会损失多少。“。

但是,韦伯说,组织有权收集的唯一材料是可以公开查看的;更多的具有文化或历史重要性的数据保存在人们的档案中,比如他们的硬盘。但我们很少有人会把这些留给子孙后代。

“大英图书馆里堆满了人与人之间的信件。政客之间有交流,或者情书,这些东西对一些人来说真的很重要。“。

我们认为,我们在社交网络上发布的材料将永远存在,只需点击键盘即可。但是,开创性的社交网站MySpace-曾经是美国最受欢迎的网站-最近失去了大约12年的音乐和照片,这表明,即使是存储在最大的网站上的材料也可能不安全。

即使是谷歌的服务也不能幸免。搜索巨头Google+试图与Facebook抗衡的社交网络已于4月2日结束。它的所有用户都备份了他们在上面分享的照片和记忆吗?

“把你的照片放到Facebook上并不是存档,因为总有一天Facebook会不复存在,”韦伯说。如果你对网络的临时性有任何怀疑,可以花几分钟浏览一下百万美元的主页。这证明了我们在网上的过去正在以多么快的速度消逝。

数据丢失还有另一面。温迪夫人指出,不将新闻网站上的故事存档可能会导致对历史的选择性看法-例如,新政府选择不保存让他们看起来不光彩的故事或档案。

伦敦大学(University Of London)数字人文教授简·温特斯(Jane Winters)表示:“一旦政府更迭或半官方机构重组,网站就会关闭。”“或者看看竞选网站,它们的性质是临时的。”

有时,遗失的遗址会呼应更具震撼性的变化;国家本身的死亡和诞生。“这发生在南斯拉夫,.yu是南斯拉夫的最高领地,当它崩溃时就结束了。有一位研究人员正试图重建分手前的状况,“她说。

或许,还有一线希望。“我来自历史背景,我们总是要处理历史记录中的空白,有些是我们知道的,有些是我们根本不知道的。”

温迪·霍尔夫人也看到了与体检的相似之处。20世纪60年代末,当她15岁时,她作为观众之一出现在英国广播公司(BBC)音乐节目“流行之巅”(Top Of The Pops)的录音带中。

这场演出是在圣诞节上映的。“电视开着,我妈妈说‘你在这儿!但是我错过了。从那以后,我去了英国广播公司(BBC),试图拿到一份副本-他们把它录了下来。我从来没有机会看到它。“

你喜欢这个故事吗?那我们要请你帮个忙。加入您的读者行列,在韦比奖中为我们投票吧!它只需要一分钟,有助于支持原创的、深入的新闻报道。谢谢!。

在Facebook上为我们点赞,或者在Twitter或Instagram上关注我们,加入90万+未来粉丝。

如果你喜欢这个故事,可以注册bbc.com每周专题时事通讯,名为“如果你这周只读了6件事”。精选BBC“未来”、“文化”、“资本”和“旅游”中的故事,每周五发送到您的收件箱。