汽车在没有经过优化的碰撞测试中表现如何?

2020-06-30 23:12:10

汽车在没有特别优化的碰撞测试中表现如何?任何时候,只要你有一个被认真对待的基准,一些人就会开始玩弄基准。一些著名的计算示例有CPU基准测试、SPECFP基准测试和视频游戏基准测试。有了specfp,Sun设法将其在179.art(specfp的一个子基准测试)上的得分提高了12倍,其编译器调整实质上重写了基准内核,从而将Sun UltraSPARC的总体specfp得分提高了20%。有时,GPU供应商会在他们的驱动程序中添加专门的基准检测代码,以在基准测试期间降低图像质量,以产生更高的基准测试分数。当然,玩基准游戏并不是计算机独有的,我们在其他领域也看到人们这样做。我们看到这种行为并不奇怪,因为通过在基准上作弊来提高基准得分比通过实际改进产品来提高基准得分要便宜得多(因此ROI更高)。

因此,当人们过于认真地对待高度具体和知名的基准时,我通常会持怀疑态度。没有其他数据,您就不知道当条件与基准中的条件不相同时会发生什么。有了GPU和CPU基准测试,大多数人都可以运行条件稍有调整的标准基准测试。如果结果因为条件的微小变化而显著变化,那就证明了供应商即使没有作弊,至少也掩盖了事实。

物理设备的基准可能更难再现。车辆碰撞测试就是一个很好的例子--它们是非常具体和众所周知的基准,会在一些测试运行中消耗一辆车。

虽然有多个组织进行碰撞测试,但每个组织都有各自遵循的特定协议。如果有这种倾向,汽车制造商可以根据碰撞测试分数而不是实际安全性来优化他们的汽车。对于不是亿万富翁的人来说,检查碰撞测试是否在进行超特定的优化是不可行的。我们可以检查的最简单的方法是看看当添加新的测试时会发生什么,因为这会让我们看到碰撞测试的结果,制造商并没有仅仅为了获得好的分数而进行优化。

虽然有汽车碰撞测试结果显然比没有好,但结果本身并不能告诉我们,当我们遇到与基准不完全匹配的事故时会发生什么。不幸的是,如果我们遇到车祸,我们不能要求我们再次相撞的车辆的司机改变他们的位置、撞击角和速度,以便碰撞符合IIHS、NHTSA或*NCAP的测试协议。

在这篇文章中,我们将看看IIHS在添加(驾驶员侧)小重叠和乘客侧小重叠测试时的分数,这两个测试分别是在2012年和2018年增加的。我们将从总结结果开始,然后讨论这些结果意味着什么,以及在评估汽车安全时要考虑的其他因素,然后是方法的细节。

下面的排名主要基于2012年添加驾驶员侧小重叠测试时车辆的得分情况,以及修改车型以提高测试结果时的得分情况。

这些描述是近似值。本田(Honda)、福特(Ford)和特斯拉(Tesla)是最不适合这些描述的,福特可以说介于Tier 4和Tier 5之间,但也可以说比Tier 4更好,不适合分类,本田和特斯拉并不真正适合任何类别(它们的类别是最适合的),但其他一些类别也不完美。详情如下。

如果我们看看美国的总体死亡率,有一个相当大的年龄段,车祸是主要的死亡原因。虽然数字会根据我们查看的数据集而有所不同,但当添加驾驶员侧小重叠测试时,IIHS估计25%的车辆死亡来自小重叠撞车。同样值得注意的是,至少自上世纪90年代以来,小型重叠撞车被认为与很大一部分车辆死亡有关;这在2012年并不是一个新概念。

尽管小重叠碰撞很重要,但从IIHS在2012年和2018年增加驾驶员侧和乘客侧小重叠测试时的结果来看,似乎几乎所有的汽车制造商都在优化基准,而不是整体安全。除了沃尔沃,所有汽车制造商都检查了在驾驶员侧小重叠碰撞中表现不佳的生产汽车,直到添加了驾驶员侧小重叠测试。

当2012年增加驾驶员侧小重叠测试时,大多数制造商都对车辆进行了改装,以提高驾驶员侧小重叠测试分数。然而,在2018年IIHS增加乘客侧小重叠测试之前,大多数制造商都在乘客侧吝啬。当增加新的测试时,他们也加强了乘客的安全。为了对汽车制造商公平,他们中的一些人在2012年增加驾驶员侧测试时就得到了小型重叠撞车的提示,不需要进一步修改就能在乘客侧测试中取得好成绩,包括梅赛德斯、宝马和特斯拉(可以说还有其他几家,但在其他情况下数据较薄;沃尔沃不需要提示)。

我们还可以在许多其他领域观察到,大多数汽车制造商都在以牺牲安全为代价来优化基准。

另一个问题是碰撞试验假人过多。在很长一段时间里,成年的NHSTA和IIHS测试使用的是20世纪70年代50%的男性假人,重5&39;9&34;,重171磅。监管机构在1980年就呼吁设立一个女性假人,但由于里根时代的预算削减,最初的计划被搁置,直到2003年,NHSTA才在汽车上安装了一个假人。女性假人是男性假人的缩小版,缩小到只有20世纪70年代身高和体重的5%(108磅;另一种模型是97磅,4';11";;4';11";;4';11";;4';11";4';11";4';11";)。在正面碰撞测试中,当使用女性假人时,总是乘客(在一次NHSTA侧面碰撞测试和IIHS侧面碰撞测试中,一个5%的女性坐在司机的座位上)。作为参考,2019年,美国成年男性的平均体重为198磅,美国成年女性的平均体重为171磅。

使用20世纪70年代的美国成年男性碰撞测试假人会在一定程度上过度适合70年代50%的年轻男性。例如,从90年代开始,制造商开始增加防止鞭打的系统。沃尔沃和丰田使用的是一种减少男性和女性鞭打的系统,似乎对女性的好处略有增加。大多数汽车制造商使用的一种系统可以减少男性的鞭打,但平均而言,对女性的鞭打伤害几乎没有影响。

似乎我们也看到了类似的针对撞车的优化,而不仅仅是鞭打。我们没有这方面的碰撞测试数据,查看真实世界的安全数据超出了这篇文章的范围,但我要注意的是,大约在NHSTA让5%的女性假人进行一些碰撞测试之前,大多数未命名为沃尔沃(Volvo)的汽车制造商在侧面碰撞中的死亡率因性别而存在显著差异(男性死亡率较低,女性死亡率较高)。

沃尔沃声称,几十年来一直在使用计算机模型来模拟如果女性(包括孕妇)卷入车祸会发生什么。

据说沃尔沃有一个碰撞测试设施,他们在那里进行许多其他碰撞测试,这些测试不是由测试机构进行的。当他们被加入时,他们在小重叠测试中得分很高的一个原因是,他们在IIHS开始进行小重叠碰撞测试之前就已经在做小重叠碰撞测试了。

沃尔沃还表示,他们测试侧翻(IIHS测试车顶强度,NHSTA根据汽车的特性计算汽车翻滚的难度,但这两项测试都没有测试真正的翻车事故中会发生什么)、后部碰撞(沃尔沃声称这些测试对于测试三排SUV的第三排是否有儿童特别重要),以及驾驶偏离道路(沃尔沃有一条他们使用的标准沟渠;他们声称这项测试很重要,因为冲出马路会牵涉到很大一部分。

如果其他汽车制造商也做类似的测试,我也找不到太多关于细节的信息。根据碰撞测试分数,他们似乎在2012年前没有做过,甚至没有考虑过小重叠碰撞测试。根据2018年增加乘客侧小重叠测试时,有多少汽车制造商的得分很低,我认为,如果其他汽车制造商有一大套他们进行的碰撞测试,而这些测试不是由测试机构进行的,那么我认为这将是令人惊讶的,但从理论上讲,他们有(只是不包括)乘客侧小重叠测试是可能的。

我们不应该从这些测试结果中得出过于笼统的结论。如上所述,碰撞试验结果测试非常特殊的条件。因此,当增加几个新的碰撞测试时,我们可以得出的结论也是非常具体的。此外,在解释这些结果时,我们还应该牢记其他一些事情。

此数据的一个限制是,我们没有同一模型的大量副本的结果,因此我们无法观察到模型内的变化,这可能是由于测试条件中微小的、有效随机的差异以及同一模型的不同副本之间的制造差异造成的。我们可以观察到这些确实很重要,因为当测试同一车型的两个副本时,一些汽车会看到不同的结果。例如,以下是IIHS关于道奇飞镖的报告中的一句话:

道奇飞镖是在2013年车型年推出的。对DART进行了两次测试,因为车载(车内)摄像头的电源在第一次测试期间中断。在第二次DART测试中,当铰链从门框上撕开时,驾驶员的车门打开了。在第一次测试中,铰链严重损坏,较低的一个被撕开,但门仍然关闭。在每次测试中,DART的安全带以及前帘和侧帘安全气囊似乎足以保护假人的头部和上半身,而假人的测量结果显示,头部和胸部受伤的风险很小。

看起来,如果车内摄像头的电源没有被切断,只会有一次测试,而且不会知道车门有因铰链撕裂而脱落的风险。一般来说,我们没有关于如果测试同一型号的另一个副本会发生什么的直接信息。

仅使用IIHS数据,我们在这里可能做的一件事是还考虑由同一制造商(或基于同一平台)制造的不同型号的结果。虽然这不如对同一型号进行多次测试,但同一制造商的不同型号之间的测试结果是相关的,而且我们知道,例如,偶然发生的一款型号的第二次测试结果明显更差,这可能会降低我们对同一制造商其他测试分数的信心。还有一些事情让这件事变得复杂,例如,如果看看马自达,马自达2实际上是重新命名的丰田雅力士(Toyota Yaris),所以也许这不应该被视为综合测试结果的一部分,做这种统计分析超出了本文的讨论范围。

虽然我认为这不应该影响这篇文章中的结果,但在查看碰撞试验结果时要考虑的另一个问题是如何在模型之间共享结果。正如我们刚刚看到的,同一模型的不同副本可能会有不同的结果。出于碰撞测试的目的,有些相似的车辆通常被认为是相同的,并且将共享相同的分数(只有一种型号将接受测试)。

例如,起亚Stinger和Genesis G70就是如此。起亚Stinger比G70长6&34;一个满载的AWD Stinger比基本型G70重约500磅。G70是IIHS测试的型号--如果你查找起亚Stinger,你会得到Stinger的分数,并注明测试了基础型号G70。这是一个相当大的差异,考虑到名义上相同的汽车(如上面提到的道奇飞镖)可以得到不同的分数。

我们还应该注意不要在时间上过度概括。如果我们看看最近沃尔沃(Volvo P3和Volvo SPA平台上的车辆)的碰撞测试分数,就会发现碰撞测试分数非常突出。然而,如果我们看看基于老款福特C1 Platform 1的沃尔沃车型,其中一些车型的碰撞测试分数并不高(特别是,尽管S40的分数并不低,但它在某些类别的分数是可以接受的,而不是整体上都很好)。尽管沃尔沃最近取得了出色的碰撞测试成绩,但这并不意味着他们一直拥有或将一直拥有出色的碰撞测试成绩。

我们也不能对在不同市场销售的汽车一概而论,即使是听起来可能相同的汽车也是如此。例如,请看在欧洲生产的日产NP300与在非洲销售的日产NP300的碰撞测试。由于欧洲汽车接受了EuroNCAP测试(类似于美国汽车接受NHSTA和IIHS测试的方式),所以在欧洲销售的汽车经过优化,可以在EuroNCAP测试中获得高分。在非洲销售的碰撞测试汽车是最近才进行的,因此汽车制造商没有公关压力,要求他们根据基准优化汽车,他们将生产更便宜的车型,或者是表面上看起来是同一款车型的更便宜的变种。这似乎与美国或欧洲的大多数汽车制造商的做法没有什么不同--只要他们能做到这一点,基准得分不会太低,他们就会优化成本。这就是说,由于没有非洲碰撞测试基准,这意味着他们可以在成本与安全的权衡方面全力以赴。

随着时间的推移,越来越多来自碰撞安全的低垂果实被采摘,这使得避免碰撞变得相对重要。与碰撞测试相比,碰撞缓解测试是相对原始的,我们已经看到碰撞测试有和有重大漏洞。

一辆2700磅的超小型车得分很好,可能比一辆5000磅的SUV得分可以接受的情况差。这是因为小重叠测试涉及驾驶车辆进入固定的障碍物,而不是特定重量的参考车辆或类似车辆的障碍物。从某种意义上说,这相当于将车辆撞到了同等重量的车辆上,因此,这就好像2700磅的超小型车是通过将其运行到2700磅的超小型车中进行测试的,而5000磅的SUV是通过将其运行到另一辆5000磅的SUV中进行测试的。

我们已经讨论了一些我们应该降低对碰撞测试分数信心的原因。如果我们想要增加我们对结果的信心,我们可以查看其他测试机构的测试结果并将其汇总,还可以查看公共的撞车死亡数据(稍后将详细介绍)。我没有看过其他机构评分的条款和条件,但一个复杂的问题是,如果你使用其他机构的API或数据转储,IIHS不允许你显示任何形式的聚合结果(因为这个原因,我没有在这篇文章中使用他们的API)。

公开的坠机死亡数据很复杂,值得发布。在这篇文章中,我会注意到,如果你看一下美国人最简单的相关数据,这些数据并不表明沃尔沃汽车特别安全(或不安全)。例如,如果我们看一下这份2017年的报告,其中涵盖了2014年的车型,有两款沃尔沃车型进入了报告,这两款车型的得分都大致在他们班级的中间。在前一份报告中,包括了一款沃尔沃车型,它是同类中最好的;在下一份报告中,包括了一款沃尔沃车型,它是同类中最差的。对于其他模型,我们也可以观察到这种变化。例如,在2014款车型中,大众高尔夫(Volkswagen Golf)是所有车辆(不仅仅是同类车辆)死亡率最高的车型之一。但在2017年的车辆中,它的死亡率是所有车辆中最低的之一。目前还不清楚这种变化有多少来自随机变化,有多少是因为2014年和2017年V之间的差异。

总体而言,噪音似乎是影响结果的一个相当重要的因素。如果我们看一下提供的信息,我们会发现一些奇怪的事情。首先,有一些车辆的死亡率95%的置信区间是从0到N。我们应该有相当强的先例,2014年没有一款车型如此安全,以至于在车祸中死亡的可能性为零。如果我们采用贝叶斯方法(尽管我相信报告的作者不是),并且有人告诉我们车辆的真实死亡率的不确定区间包括零,那么我们会说要么我们应该使用信息更丰富的先验,要么我们应该使用可以包含更多数据的模型(在这种情况下,也许我们可以尝试理解同一类别中不同模型的死亡率之间的差异,然后使用该类别的基本死亡率作为先验,或者我们可以将该类别的基本死亡率作为先验,或者我们可以将其作为先验,或者我们可以使用包含更多数据的模型(在这种情况下,也许我们可以尝试理解同一类别中不同模型的死亡率之间的差异,然后使用该类别的基本死亡率作为先验。

一些人反对使用信息丰富的前科作为偏见洗钱的一种形式,但我们应该注意到,用于IIHS分析的先例并不是完全没有信息。所有报告的间隔都停在零,因为他们是在利用车辆不能创造生命的事实来将间隔限制在零。但我们有几乎同样有力的信息,即2014年没有哪辆车如此安全,以至于预期死亡率为零,使用这些信息与将区间上限设为零,并且不报告不确定的死亡率区间的负数,并没有本质上的不同。

此外,IIHS的数据只包括司机死亡人数。这是可以理解的,因为这是将车内乘客数量正常化的最简单方法,但这意味着,在2018年增加乘客侧小重叠测试之前,我们不可能看到汽车制造商没有改善乘客小重叠安全的影响,这是因为沃尔沃认为重要的情况(第三排SUV后排的孩子)缺乏后部碰撞测试,等等。

如果我们想要回答哪种汽车或车型或多或少是安全的这个问题,我找不到任何公开提供的数据令人满意,我认为我们需要查看源数据,并进行自己的分析,看看数据是否与我们在碰撞测试结果中看到的一致。

我们观察了12个不同的汽车制造商,以及当IIHS增加小重叠测试时它们的表现如何。我们看到,在公司因小重叠安全问题而被IIHS公开羞辱之前,只有沃尔沃认真对待这类事故,尽管至少自上世纪90年代以来,小重叠撞车已被认为是死亡的一个重要来源。

尽管我没有进行其他测试的预算,比如在一辆满员的汽车上进行尾部碰撞测试,但这似乎是合理的,甚至可能是,如果一家测试机构决定增加另一种碰撞测试,大多数不在沃尔沃(Volvo)的汽车制造商的测试成绩将平平或不佳。

正如希勒尔·韦恩(Hillel Wayne)所指出的那样,尽管程序员通常对真正的工程师所做的事情有理想化的看法,但当你比较真正的工程师与程序员所做的事情时,你会发现&。

..