带有Markdown和Git的博客,并随着时间的流逝而优雅地降级

2021-02-09 20:29:28

(问题1)由于前一周我逐渐恢复了RSS习惯,我不禁注意到我有多少旧订阅已死。不是“不再发布”了,而是“从互联网上消失了”。人们创建了博客(很多内容丰富),运行了一段时间,让博客消失了,最终它们被时间和熵吞没了。

(问题2。)Wayback Machine非常好,并且是互联网的重要资产之一。但这并不完美。它相当慢,并且经常丢失诸如图像或整个页面之类的资产(尤其是在涉及较小的博客的情况下)。最重要的是,它的内容是无法发现的-没有精确的原始URL很难找到内容。

(问题3。)为了娱乐,我尝试从Wayback Machine上“取消存档”旧同事的博客。获取前几页很容易,但是要获得完整的内容以及质量/精度非常困难。首先,我需要编写一个蜘蛛来迭代分页的存档。然后,提取器将Wordpress生成的可怕的,跟踪器缠身的HTML煮沸,以获取实际内容。然后,另一个搜寻器下载仍然可用的任何图像。

我想向现在和将来的博客作者提出一个简单的建议:以所需的任何技术运行博客,无论其是Hugo或Gatsby之类的静态生成器,自定义CMS还是JAM堆栈。不同的技术对不同的事物有好处,人们对不同的工具也有好处,并且肯定有很多不错的选择。

但是,请记住,归根结底,博客是文本和多媒体。以最简单的格式存储您的内容(我建议Markdown和Git),并使用出色的前端从中读取内容并根据需要进行渲染。通过GitHub或其他最受欢迎的长期抗腐蚀主机将该源公开。 Git具有可移植性,因此您可以随时复制或移动存储库。

不管是一个月,一年,还是五年,都没有关系,但是一旦达到10年以上的水平,一切开始消失,这可能确实会有所作为。即使原始主机已久,有兴趣的各方仍然可以看到阅读的内容。没有人计划让他们的网站消失,但大多数人最终还是会消失。

我练习我的讲道。整个网站都是从Markdown生成的,并且也存在于GitHub上。即使它消失了也可以重新混合。