在不宣布破产的情况下进入收件箱零

2020-09-20 13:39:17

我写了一个脚本,分析提供的Gmail转储文件,给出方便的Gmail搜索查询,以便快速存档您可能不需要阅读的电子邮件。这是通过查看发件人的收件箱电子邮件来实现的,因为我发现我的收件箱中大部分都是来自数量相对较少的发件人的交易性/广告电子邮件。我更喜欢它,而不是空白地存档所有未读的邮件,因为你可能会错过一些重要的东西。该脚本比在线服务更安全,因为您不需要授予任何OAuth权限,也不需要将数据发送到任何地方。

我的个人Gmail上从来没有收件箱为零。事实上,在经历了十多年糟糕的电子邮件卫生之后,我积累了堆积如山的未读邮件(500+),收件箱中总共有8000多封。弄得一团糟让人很不舒服,但简单地“宣布破产”并全部或大部分存档也是不负责任的。我想一定有一种更快的方式来查看电子邮件,而不需要梳理所有的8000多封电子邮件。经过一番思考和编码,我能够在短短几个小时内安心地通过这堆东西!

我很惊讶我收到了这么多信息,因为我不经常使用我的私人电子邮件。我的理论是,绝大多数是交易性电子邮件和广告电子邮件-来自亚马逊(Amazon)和优步(Uber)等网站的收据,以及营销垃圾邮件。在这些信息中隐藏着一些我想看到的信息。

因此,如果我的理论是正确的,我应该会看到来自这些公司的一长串收件箱电子邮件:可能来自亚马逊的100封,来自优步的200封,来自优衣库的50封,以此类推。我想:如果我能生成我的电子邮件按发件人分组的直方图,我就可以构建一个可以安全地自动存档的电子邮件的Gmail查询。

期待柱状图遵循幂律似乎是合理的;我使用的服务很少,在取消订阅之前,我会允许这种级别的垃圾邮件。记住这一点,如果8000条信息中有85%是即时存档的,那就是数百个发送者。通过手动过程很慢,例如(1)浏览收件箱以找到竞争者(2)执行Gmail搜索(通常很慢)(3)全选并存档所有(通常也很慢)(4)对所有数百个发件人重复这一过程。(2)执行Gmail搜索(通常很慢)(3)全选并存档(通常也很慢)(4)对所有数百个发件人重复执行。

这个过程似乎可以通过一些轻量级分析来加速。我调查了一些电子邮件分析服务,但对向公司提供OAuth访问我的个人电子邮件感到不舒服。我决定构建我自己的…不应该那么难。

我从查看Gmail API开始,但意识到我想要执行的批量操作可能相当慢,并且增加了必须实现OAuth的复杂性。相反,考虑到这个应用程序可能是每个用户一次性使用的,我可以省去棘手的Google API部分。使用Google外卖,我可以转储Mbox格式的收件箱电子邮件,然后拼凑出一个命令行脚本来进行一些轻量级的分析。

该脚本按发件人对所有电子邮件进行分组,并按收件箱电子邮件总数进行排序。然后,它会对这些计数进行直方图筛选;向您显示最严重的违规者,并将其分组。最后,它会列出Gmail搜索查询,这样你就可以很容易地自动存档那些显而易见的电子邮件(我看着你呢,优步/亚马逊!)。有趣的是,我的直方图顶端大多是朋友发来的电子邮件,或者是我给自己发来的提醒,说我从来没有存档过,尽管在第一打左右的电子邮件之后,“垃圾邮件”就出现了。

剧本果然证实了这一理论。46个发件人占我所有收件箱电子邮件的近45%!

最后,我能够在没有破产的情况下进入零号收件箱。一路上,我发现了几封被遗忘的有价值的电子邮件-一些亮点包括向避难所家庭捐赠一台旧笔记本电脑的机会,提醒家人被欠下的退款,一次志愿者机会,以及朋友们的未读信息。

请记住,此脚本100%在执行机器上运行,不发送任何传出请求;所有数据都保留在您的计算机上。

0。获取您自己的Mbox导出。这可以通过谷歌外卖用Gmail完成。请确保将筛选器设置为仅从收件箱中抓取电子邮件。

收件箱快捷工具将提示您输入一些内容,其中大部分是可选的,其中最重要的是Mbox文件的路径。

所有时间发件人的直方图,每个存储桶占未读总数的百分比。

它还会提示您输入您想要从之后生成的Gmail过滤器中排除的任何全天候发件人。

将这些过滤器复制并粘贴到您的Gmail搜索栏中存档!请注意,由于Gmail搜索收件箱似乎有字符限制,因此可能会产生许多查询。