佛罗里达州卫生部有一个惊人的数据集:该州新冠肺炎病例的完整列表数据,包括所有10万+病例的年龄信息!我的脚本处理该数据:
这将创建一个热图(heatmap.png),表示一段时间内按年龄段划分的病例数:
默认情况下,每个像素或存储桶的大小是10年年龄段和7个日间周期。这可以通过编辑变量Buckets_Aages和Buckets_Days进行更改。
$./process.py佛罗里达州每7天时间段内按年龄段划分的新冠肺炎病例数随时间变化:时间段,00-09,10-19,20-29,30-39,40-49,50-59,60-69,70-79,80-89,90-199,中位数2020-02-29,0,0,2,0,0,2,3,2,0,0,63.02020-03-07,0,0,4,2,5,8,18,11,2。2、18、76、62、80、83、105、63、26、8、53.02020-03-21、13、63、370、441、442、515、399、350、155、33、51.02020-03-28、49、126、948、1146、1228、1330、1109、774、358、80、50.02020-04-04、53、148、881、1179、1265、1418、1214、747、438、138、51.02020-04。50.02020-04-18、85、200、706、904、860、1039、804、553、441、229、51.02020-04-25、65、175、596、703、682、804、632、458、388、179、51.02020-05-02、70、175、624、661、665、676、541、437、399、180、50.02020-05-09、86、183、653、728、710、7。46.02020-05-23、159、344、849、968、886、773、533、311、253、98、42.02020-05-30、318、589、1180、1292、1127、989、718、405、253、133、41.02020-06-06、449、804、2436、2025、1570、1451、933、525、366、174、38.02020-06-13。6294、4283、3114、2634、1499、858、437、173、34.0(上期';%s数据不完整。114018例中有139例年龄不详)。
在所有年龄段中,病例数量都在增加。然而,病例的中位年龄正在下降,因为年轻人似乎推动了更多的传播,特别是20-24岁的年龄段。
py是一个从CSV文件中剥离ObjectID列并对行进行排序的工具。这对比较在2个不同日期发布的2个CSV文件很有帮助,因为每个文件的ObjectID值和行顺序都不稳定。