使用FOIA数据和Unix将停车罚单的主要来源减半(2018年)

2020-10-26 08:20:53

这将是我在互联网上发表的第一篇博客文章。希望它是有趣和准确的。如果你看到任何错误,请指出!

2016年,我做了一些工作,试图找到停车罚单的热点地区,看看一点点数据是否可以减少这些地区的停车罚单。最后,我只清理了一个,但它是芝加哥所有罚单最多的地方之一,导致停车罚单减少了大约50%。

芝加哥用来存储停车罚单的系统被称为Canvas。它是芝加哥市违规、通知和裁决业务流程和系统支持的缩写,由IBM管理。它最近的一份合同始于2012年,将于2022年到期,标价超过1.9亿美元。

芝加哥的大部分合同及其采购请求(RFP)PDF都在网上发布。在Canvas的合同中,它提供了相当多关于Canvas后端基础设施的信息,包括它使用Oracle 10g的事实。换句话说,可以通过IBM运行一些简单的SQL来满足FOIA请求。

有了这些信息,以及后来几个失败的信息自由法请求,我发出了以下请求,以获取2009年1月1日至2016年3月10日的停车罚单数据:

请向我提供2009年至今所有停车罚单的所有可能信息。这应包括与汽车(制造商等)、车牌、罚单、票务、罚单原因、财务信息(已支付等)、法庭信息(有争议等)、情况(例如,时间、地点)和照片/视频相关的任何信息。理想情况下,这还应该包括存储在Canvas中的任何与票证相关的信息。

大约一个月后,一个叫Carl的家伙(穿着花哨的西装)递给我一张CD,里面有一些极其混乱的数据,其中有一个分号分隔的文件,名为A50462_TcktsIssdSince2009.txt。该文件包含2009年1月1日至2016年3月10日期间17,806,818张停车罚单和跨度的信息。

Head-5 A50462_TcktsIssdSince2009.txt票号;车牌号码;车牌状态;车牌类型;罚单制作;发放日期;违章位置;违章代码;违章描述;徽章;单位;罚单队列;听力显示39596087;zzzz;IL;PAS;volv;03/03/200311:25 am;3849W Congress;0976160F;过期车牌或临时REGISTRATION;11870;701;Paid;40228076;zzzzzz;IL;TRK;FORD;03/01/2003 12:29 am;3448N OKETO;0964170A;卡车、房车、公交车或出租车或居民街;17488;016;定义;40480875;zzzz;IL;PAS;Pont;03/01/200309:45 pm;8135S Perry;0964130;Park or block ALLEY;17575;006;Notice;40718783;zzzzzz;IL;PAS;ISU;03/02/2003 06:02 pm;6928S Cornell;0976160F;过期车牌或临时登记;7296;003;已支付;有责任

这相当于一个极其混乱和不可预测的数据集,很难准确地映射到经度/经度,这是任何类型的综合GIS分析所必需的。有很多地理编码器服务可以在这方面提供帮助,但它们中的大多数都有大约50%的准确率。也就是说,在稍微擦洗一下的帮助下,这一数字可以提高到接近90%。另一个帖子换个时间。

我特别感兴趣的是寻找那些有突出热点的地区。我花了很多时间来解决这个问题,并最终编写了两系列(繁琐的)命令,以确定一个潜在的可修复位置。

最初,我所做的工作和分析是使用Unix命令和gnplot的组合。从那时起,我已经将我的代码迁移到python+matplotlib+sql。但是,为了这个博客,我想展示一下最初的分析。

$Mawk-F&39;;';';{print$7}';all_tickets.Orig.txt|sed-r';s/^([0-9]*)[0-9][0-9](.*)/\100\2/';|sed-r';s/(Blvd|ST|AV|ave|RD)$//';|SORT|uniq-c|SORT-nr 79320 1900W奥格登60059 1100N州50594 100N沃巴什44503 1400N密尔沃基43121 1500N密尔沃基43030 2800N百老汇42294 2100S弓箭手42116 1900W哈里森。

$Mawk-F&39;;';{打印$9,$7}';A50462_TcktsIssdSince2009.txt|sed-r&39;s/(Blvd|ST|AV|AVE|RD)$//';|SORT--PARALLEL=4|uniq-c|SORT-nr12510过期车牌或临时登记5050 W 55 9636任何时候禁止停车/站立835 N密歇根州8943个过期车牌或临时登记1 W停车场A 6168个过期车牌或临时登记1 W停车场E 5938随时禁止停车/站立500 W麦迪逊5663公园或公共汽车/出租车/车厢站台1166 N州5527个过期计价器或超期停留5230 S Lake Park 4174随时禁止停车/站立1901 W哈里森4137前后车牌要求1 W停车场A。

这两段代码都粗略地显示出1100N道德街发生了什么事,1166N道德街看起来特别可疑。

这是一个出租车站,从晚上7点到早上5点,有三辆车的长度。在出租车站停车是100美元的罚单。

当这个地方不是出租车站时,它就是计价器停车--在巷子后面的停车计价器。

在这里停车可以在晚上7点以后付费,这让停车看起来是可以接受的-特别是在那里漂浮着“芝加哥公园”的标志的情况下。

混乱会造成更多的混乱--如果一个停车场停在那里,那么就会有更多的车跟在后面。恰恰。

考虑到这一切,我在4月12日联系了第二选区的市议员办公室,解释了这一点,并得到了以下回复:

在此期间,我强烈建议您不要在那里停车,以免再开罚单。

我不知道你有没有注意到道富银行在3号出租车站台上安装了额外的交通指示牌。

新的的士站标志为一个以前没有边界的的士站划定了边界。禁止停车的标志清楚地表明,在出租车停靠站时间内在这里停车是一种可罚款的违法行为。干净利落!

我最近决定看看那个地方的门票数量。利用来自另一个FOIA请求的一组新数据,我使用Python、PANAS和SQL进行了一些分析。我发现,新标志的增加有效地导致1150至1200州立大街之间的停车罚单减少了50%。与2016年相比,2017年减少了约400张罚单,2018年到目前为止减少了200张。总而言之,那是价值6万美元的停车罚单!

总而言之,芝加哥的停车罚单数量正在上升,这项工作表明,即使是很小的事情,也是可以做的。

这项工作只在一小段道路上进行,但我相信类似的工作也可以在系统的范围内进行。这在很大程度上只是一个挖掘数据并直接与每个病房合作的问题。

这里后面的分析也是根据税务局给我的最新数据集进行的。这两个数据集有一组不同的列,因此这两个数据集仍然需要组合。我希望能尽快做到这一点!