事后看来,这一点似乎很明显。在波兰,自疫情爆发以来,人们一直在猜测:在私人谈话中,在社交媒体上的随机帖子中,在政府信息机构下的评论中。似乎有人想出这样的东西只是个时间问题。事实上,在10月份的一个周日晚上,我发现自己大吃一惊,显然还没有人这么做。
我为一个名为koronalotek.pl的域名支付了4美元(可以翻译为“coronalotto”或“coronalottery”-这个名字在Twitter上的出现至少可以追溯到4月份),并引发了一个新的REPL。几个小时后,250个Clojure LOC之后,网站就上线了。
我一直希望它能尽可能简单。一张表格,上面有两个栏:“你的名字”和“明天有多少箱?”根据波兰卫生部每天在推特上报道的猜测和实际病例数量之间的绝对差异,列出了今天十大获奖者名单。官方数字,醒目地显示出来。仅此而已。
10月17日,我在Facebook和Twitter上发布了这个链接,并等待着。一连串的猜测开始陆续涌入。
它从未成长为一条更多的溪流,但它也不是完全不被注意到的。
上面的图表显示了随着时间的推移,每天被接受的猜测次数(即那些被用来产生第二天获胜者的猜测)-这是衡量受欢迎程度的一个重要指标。每天的数字意味着在截至当天上午10点半(华沙时间)的24小时内进行的猜测,这一天是卫生部公布官方数据的时候。
我一直在过滤掉自动提交,以及同一个IP提交的过量手动提交,这些提交似乎太过扭曲了结果-我随意地将“过量”门槛设置为10。10月19日缺失的数据点不是零,而是一个数字不适用:由于一个小故障,我丢失了那个数据点。下面将详细介绍这一点。
这一兴趣在10月23日达到顶峰,当天有超过1万次猜测(我想这是当时一个非常有影响力的人转发的),此后一直在缓慢下降。
我可能私下收到了一些反馈。一位人士指出,他们发现这个网站令人反感,取笑流行病悲剧让他们感到不舒服。(我很同情;对我来说,与其说这是一种取笑,不如说这是一种有效的应对机制-一种将我的想法与我们所处的困难时期保持距离的一种有效方式,也是一种遏制恐惧的方式。)。然而,有些人感谢我让他们在猜对了或多或少的时候都笑了。
回到数据上来。作为一个超级数据迷,我不得不看看我之前一直在收集的东西。首先要做的是:猜测者的集体预测力有多准确?
事实上,相当准确!通过过滤掉不在[100;50000]范围内的“不合理”猜测,这个曲线图的数据只经过了轻微的预处理。
人们高估和低估了新病例的数量,但估计的幅度不大。只有极少数情况下,实际案例数没有落在猜测平均值(由情节上蓝色条周围的胡须表示)的一个标准差内。诚然,每天的标准差往往不会很大(大约几千),但尽管如此,我还是印象深刻。一篇关于根据冠冕抽奖结果估计流行病增长的论文即将在你附近的一本杂志上发表!;-)。
只是为了好玩,我也一直在关注个人选票。具体地说,就是名字。以下是10月23日按长度从大到小排序的独特猜测者名字的最新快照。(NSFW警告:前面有脏话!)。
让我为那些不会说波兰语的人翻译以下几条:
第一条是“萨辛为了没有举行的选举干了7000多万兹罗提,从来没有被追究责任。”这暗示着波兰将从5月份开始举行幽灵选举。这一消息已经成为迷因,甚至有讽刺意味的是,萨辛部长的名字被用作7000万的无因次单位(想想阿沃加德罗(Avogadro)的数字)。你会在#2、#3、#5和其他书中发现同样的主题。
第六条是“CT(宪法法庭),你这个笨蛋,别再压制我的堕胎了”。就在一天前,波兰宪法法院(波兰宪法法院目前的合法性充其量只能说是有争议的)颁布了一项禁令,禁止波兰几乎所有合法堕胎,引发了数十年来规模最大的街头抗议活动。
并不是所有的事情都与政治有关:第四个问题是“如果我们无论如何都活不到11月,为什么还要复习考试呢?”我希望写这篇文章的人还活着,身体健康。
推论?给人们一个文本字段,他们就会用它来表达自己:无论是政治上的还是其他方面的。
事实上,我已经冒昧地插话了。不久之后,我改变了感谢页面(过去只说一句“谢谢你的猜测”),骄傲地展示了妇女罢工的一个标志,以及一个为支持需要堕胎的妇女的非政府组织发起大规模众筹活动的链接。
我不是一个喜欢DevOps的人,所以我只是快速而肮脏地部署它,并不关心可伸缩性或性能。这句格言“让它尽可能简单”渗透到整个设置中。
我刚刚在很小的Scaleway C1服务器上的一个屏幕会话中启动了一个新的REPL,该服务器也托管了这个博客和我的其他一些个人资料。我还在其中启动了一台njetty服务器,并设置了一个nginx代理。差不多就是这样。在“生产”阶段,我可以随意修改应用程序的状态,在我想要的时候评估各种表情。
代码更改是通过Git在REPL中进行新的开发和操作(需要koronalotek.core:reload)来部署的。
有人尝试了一种简单的SQL注入攻击。这是注定要失败的,因为它不涉及SQL。事实上,根本没有数据库。整个状态保存在内存原子中,并定期同步到EDN文件中。此外,在宣布获奖者时,州政府每天都会重置和存档。(有一次我忘了存档,所以没有10月19日的数据。)。
我也还没有一个自动调入卫生部数据的有效机制。每天早上,我都会花两分钟检查是否有多余的自动投票,如果有,就把它们删除,然后填上空格:
尽管在这一设置中存在所有违反良好实践的情况,但到目前为止,它的效果出人意料地好。我已经尝试了几次删除自动投票,并两次在nginx设置中将投票机器人的IP列入黑名单,但除此之外,它一直是一个非常低维护的玩具。人们似乎都不愿意找乐子,我就是不插手。
你应该呼吁你的国家当局向波兰政府施加压力,要求他们尊重女性的选择,停止积极压制她们。