我的书“基于证据的软件工程:基于公开可用的数据”现已发布测试版(pdf和代码+数据)。计划进行三个月的审查,最终版本将在圣诞节前在商店里买到(我计划打印几百本,并在亚马逊上提供)。
接下来的几个月将用来回应读者的评论,并从我等待分析的剩余20多个数据集添加材料。
你可以给我发电子邮件发表任何评论,也可以在这本书的Github页面上添加一期。
虽然内容与我最初的想法有很大的不同,但10年前,讨论所有公开可用的软件工程数据的最初目的已经实现了(在某些情况下,更详细的数据,数量更多,已经取代了早期不太详细/更小的数据集)。
如果有公共数据,只讨论一个主题的目的在某些地方略有偏差(因为我认为数据会出现,但它没有出现,或者我想连接两个数据集,或者我还没有删除已经写好的内容)。
这两个目的的结果是,讨论的流程是非常脱节的,甚至是脱节的。另一个原因可能是我还没有想出如何以一种明智的方式将这些材料联系起来。我是第一个通过这个练习的人,所以我不知道它会去哪里。
大约620多个数据集比我认为可以公开获得的大三到四倍。更多的数据是好消息,但需要更多的时间来分析和讨论。