组织:Archive Team(不要与 archive.org Archive-It Team 混淆)成立于 2009 年,是一个流氓档案管理员集体,致力于为历史和数字遗产保存迅速消亡或删除的网站的副本。该小组100%由志愿者和相关方组成,并已扩展为大量用于保存在线和数字历史的相关项目。历史上充斥着数以百计的关于社区、团体、地点或企业未来的冲突,当其中一方挺身而出并摧毁了那里的东西时,这些冲突就“解决了”。随着最初的争论点被摧毁,辩论将被搁置。档案团队认为,通过重复谴责数据,对话和辩论可以继续,以及通过保留材料获得的丰富性和洞察力。我们的项目规模不等,从一名志愿者将数据下载到一个小而关键的站点,到 100 多名志愿者挺身而出,获取 TB 级用户创建的数据以供后代使用。 Archive Team 的主站点位于 archiveteam.org,包含有关各种项目、宣言、计划和演练的最新信息。该集合包含许多存档团队项目的输出,包括正在进行的和已完成的。由于 Internet Archive 提供了大量的磁盘空间,因此可以提供多 TB 数据集,并由 Wayback Machine 使用,提供返回丢失网站和工作的路径。我们的集合已经发展到为我们获取的数据类型提供子集合的地步。如果您想浏览这些收藏的内容,Wayback Machine 是最好的第一站。否则,您可以自由挖掘堆栈以查看您可能会发现的内容。 Archive Team Panic Downloads 是当前现存网站的完整下拉列表,旨在作为需要关闭的网站的紧急备份,或者如果由于硬盘驱动器崩溃或服务器故障而突然丢失,则会严重错过这些网站。 ArchiveBot 是一个 IRC 机器人,旨在自动归档较小的网站(例如,多达几十万个 URL)。您给它一个 URL,它会抓取该 URL 下的所有内容,将其记录在 WARC 中,然后将该 WARC 上传到 ArchiveTeam 服务器,以最终注入 Internet Archive(或其他存档站点)。要使用 ArchiveBot,请访问 EFNet 上的 #archivebot。要与 ArchiveBot 交互,您可以通过在频道中键入命令来发出命令。请注意,您需要频道操作员权限才能发布存档作业。仪表板显示当前正在下载的站点。