<;div align=#34;center&34;style=";text-align:center";>;<;h1>;How使用Nginx、Kimix或MediaWiki/XOWA+Docker<;自托管维基百科镜像(<;br/>;最初在<;a href=";https://docs.sweeting.me/s/blog";>;docs.sweeting.me<;上发布于2019年09月08日)。/a<;.<;br/>;漂亮<;a href=";https://docs.sweeting.me/s/self-host-a-wikipedia-mirror";>;HTML版本在此处<;/a>;,本指南的<;a href=";https://github.com/pirate/wikipedia-mirror";>;source在Github<;/a>;.<;/i>;<;br/>;<;br/>;有关如何使用三种不同方法设置完整维基百科镜像的摘要。<;br/>;<;b>;演示:https://other-wiki.zervice.io<;/b>;<;hr/>;<;img src=";https://chrischapman.co/images/kiwix/home-page-internal.png";Width=";500px";/>;<;/div>;#简介>;*你知道吗,维基百科刚刚在[~350 servers](https://meta.wikimedia.org/wiki/Wikimedia_servers)**?]上运行了一个基本传统的LAMP堆栈。(截至2019年)**不幸的是,维基百科招致了很多人和民族国家的仇恨,他们反对某些文章或想要向公众隐藏信息。**维基百科';的基础设施(2个机架在美国,1个在荷兰,1个在新加坡,+CDN)[不能总是经得起大型DDoSHTML,但谢天谢地,他们向公众提供常规的数据库转储和静态attacks](https://wikimediafoundation.org/news/2019/09/07/malicious-attack-on-wikipedia-what-we-know-and-what-were-doing/),存档,在中国成长过程中(在gfc背后,我经常经历维基百科的unavailability](https://www.cnet.com/news/the-great-firewall-of-china-blocks-off-wikipedia/),),鉴于最近的DDoS](https://wikimediafoundation.org/news/2019/09/07/malicious-attack-on-wikipedia-what-we-know-and-what-were-doing/),我决定为人们制作一份指南,帮助揭开运行镜子的过程的神秘面纱。在中国成长的过程中,我经常体验到维基百科的GFC,鉴于最近的GFC,我决定为人们制作一本指南,帮助揭开运行镜像的过程的神秘面纱。我也是免费访问信息的主要倡导者,我也是一个名为[ArchiveBox](https://archivebox.io)(一种由无头铬驱动的自托管互联网归档程序)的大型互联网归档项目的维护者。**本指南的目的是鼓励人们使用这些公开可用的转储文件来托管维基百科镜像,这样恶意行为者就不会成功地限制公众对*世界之一的访问。最好的信息来源*.**-##快速入门A*完整*英文维基百科克隆分3步完成。**演示:https://other-wiki.zervice.io**`bash#1.从https://www.kiwix.org/en/downloads/kiwix-serve/wget';https://download.kiwix.org/release/kiwix-tools/kiwix-tools_linux-x86_64.tar.gz';下载Kiwix-SERVE静态二进制文件。tar-xzf kiwix-tools_linux-x86_64-3.0.1.tar.gz&;&;cd kiwix-tools_linux-x86_64-3.0.1#2.从https://dumps.wikimedia.org/other/kiwix/zim/wikipedia/下载压缩的维基百科转储文件(79 GB,包括图片!)wget--继续";https://download.kiwix.org/zim/wikipedia_en_all_maxi.zim";#3.启动Kiwix服务器,然后访问http://127.0.0.1:8888./kiwix-serve--Verbose--port88php入门Wikipedia.org本身由一个名为";$PWD/wikipedia_en_all_maxi_2018-10.zim";`-[TOC]-##的后端驱动,使用[WikiMedia](https://en.wikipedia.org/wiki/MediaWiki),进行数据存储,使用varish和memcached进行请求和查询缓存,并使用Elasticsearch进行全文搜索。Production Wikipedia.org还在MediaWiki之上运行许多额外的插件和模块。**🖥有几种方式来托管您自己的维基百科镜像(具有不同的复杂性):**1.[**在Wikipedia.org前面运行缓存代理**](#)(磁盘按需使用缓存,CPU使用率低)2.[**使用Kiwix提供静态HTML ZIM归档**](#)(10~80 GB用于压缩归档,~600 GB用于XML和amp;数据库,高cpu使用率)**维基百科(💅)不要期望它一试就完美**设置维基百科镜像涉及软件、数据和系统管理之间的复杂舞蹈,所以我们鼓励初学者在尝试运行完整的MediaWiki服务器之前,先从静态的html存档或代理开始。用户应该希望他们的镜子能够提供没有图片的文本文章,但不应该期望它在第一次尝试时看起来像维基百科,或者第二次,或者第三次.**✅选择一种方法**本指南中的每种方法都有其优缺点。缓存代理是最轻量级的选择,但如果上游服务器关闭,传入以前从未见过的请求,并将其缓存到404,则它不是完全冗余的镜像。静态ZIM镜像是轻量级的下载和托管(请求很容易缓存),它有全文搜索,但它没有交互性、谈话页面历史或维基百科风格的分类页面(尽管它们很快就会出现)。麦迪