教贝叶斯垃圾邮件过滤国际象棋(2005年)

2021-01-31 02:12:34

如今,许多人依靠贝叶斯过滤器来保护他们免受垃圾邮件这种永远存在的电子邮件之害。与旧技术不同,这些程序声名fa起的是,他们会自动学习垃圾邮件模式,更重要的是,学习个性化垃圾邮件(坏)和垃圾邮件(好)电子邮件模式。像许多其他应用程序一样,我编写了一个贝叶斯过滤器来保护我免受不必要的电子邮件的侵扰,我将其称为dbacl。我的实现用作Unix命令行文本分类器,具有特殊的电子邮件支持,并且可以与procmail一起使用。人们在第一次尝试使用统计邮件过滤后通常会感到惊讶,并且很容易想到这种程序实际上可以理解所传递的电子邮件,而不仅仅是匹配模式。现在,国际象棋一直是每个人都能理解的流行智力指标,因此,如果我们将所有这些想法放在一起,那么问题“贝叶斯垃圾邮件过滤器可以下棋吗?”似乎像是一个有趣的实验,需要进行很多操作上诉。让我们制定一些基本规则:该实验将测试真正的垃圾邮件过滤器,而不是专门设计的国际象棋程序。它不会以击败“深思熟虑”为目标(我不知道从哪里开始,我仍然觉得这可能很难;-),但它的目的是要显示出“智能”的迹象。 #34;否则我们将无法获得成功。最后,由于干燥的表格和图表并不有趣,因此,理论上的概念证明还不够:垃圾邮件过滤器必须以所有人都可以看到的方式真正下象棋,然后尝试一下在家里。设计以下帐户,以便您可以自己跟踪并复制它。您只需要一台与Unix兼容的计算机即可。您将必须打开终端并准备键入shell命令。下面的所有Shell命令都以%开头,以指示提示,但是您请勿键入'%'。说明相当详细,可以在需要时下载各种脚本,但是如果您熟悉该外壳程序将很有帮助。询问朋友是否需要帮助。重要提示:如果您想真正针对垃圾邮件过滤器下棋,则必须遵循以下说明。您还必须下载一些培训游戏并事先教过滤器。仅运行脚本是不够的。这些指令已经过测试,并且可以在具有bash shell的GNU系统上正常工作。