制造芯片以延长预期寿命

2020-10-22 14:37:29

芯片应该可以持续使用,但这种预期会根据终端市场的不同而有很大差异,这取决于设备是用于安全应用还是关键任务应用,甚至是可以轻松更换或远程修复的设备。

这还取决于如何使用这些芯片,它们是否是复杂系统的重要组成部分,以及持续监测和反馈的成本是否可以在整个系统的价格中摊销。这不是一个简单的等式,也没有简单的答案,特别是在额外电路会增加功耗和降低性能的高级节点上。

Synopsys Design Group测试产品营销高级总监史蒂夫·帕特拉斯(Steve Pateras)说:“能够通过对芯片有一个基线的了解来预测可靠性和性能变化,并由此推断出事情何时会开始失败,这是最好的选择,”Synopsys设计集团测试产品营销高级总监史蒂夫·帕特拉斯(Steve Pateras)说。您需要能够进行性能和安全优化,并最终持续保持可靠性。如果一辆车开始失灵,你就会想要离开公路。“。

在过去,可靠性通常被认为是制造过程的一部分。薯片将在烤箱中烘焙一段时间,或者受到仔细监测的振动,以确定设备何时会发生故障。虽然可以在制造之前模拟不同的场景,但芯片仍可能出现故障,但次品率将会降低,这取决于各种工艺被控制得有多严格,以及可以增加多少余量来提供某种类型的故障转移。这一点在今天的ECC内存中很明显。

未来的挑战是,尤其是在高级节点上,如何利用现有电路并限制冗余量,这可能会影响功率和性能。这意味着故障转移需要更多地针对关键功能,并且需要更多地了解芯片或封装中在任何时间点发生的情况。

ProteanTecs的系统副总裁诺姆·布鲁萨德(Noam Brousard)说:“随着芯片在该领域的使用时间延长,那么从科学上讲,我们就知道了故障背后的物理原因是什么,”ProteanTecs的系统副总裁诺姆·布鲁萨德(Noam Brousard)说。“我们如何随着时间的推移对其进行监测和测量,并推断这些结果的影响?”一种简单的方法是持续测试芯片的运行情况,以及它的性能是否随着时间的推移而下降。这在多个方面都存在不足。在监测降解的功能反应时,我们可能只会注意到降解的影响,一旦它们实际上导致了故障,或者我们不知道降解的实际物理原因。也许我们无法利用这些知识来预测未来什么时候会发生失败。另一种方法是使用遥测,基于我们所说的嵌入在硅中的代理。它们总是在晶体管级别监控硅的物理参数,并绘制它们随时间退化的图。您可以将这些数据插入导致芯片老化的热载流子注入(NBTI)的知名公式中,并运行监测退化速率的ML算法,从那里您可以在实际发生故障之前计算和预测故障时间。“。

Synopsys的帕特拉斯对此表示赞同。帕特拉斯说:“这其中的一部分不仅仅是弄清楚将会发生什么。”“它提供信息,以便在某些情况下,基础设施正在执行更正。您需要有冗余,并且关键处理器必须是双锁步的。你还需要监控这类活动。“。

数据管理生命周期管理的一个关键方面是能够在从设计到制造的整个链条上自由地收集和移动数据。在过去,这些数据中的大部分都保存在竖井中,虽然这在过去被证明是管理单个工艺步骤的有效方式,但芯片、封装和系统的日益复杂使得这些数据对于确保所有这些设备的可靠性都很有用。

PDF解决方案公司总裁兼首席执行官约翰·基巴里安说:“有时候,如果你知道蚀刻工具或光刻工具是如何工作的,这可能会影响你想要做什么额外的测试。”“测试可以从了解上游处理工具中发生的情况中受益。客户可以更明智地决定测试什么,何时测试,以及是否因为特定的蚀刻剂或处理能力而对某些部件施加额外的压力。因此,共享所有这些数据的价值可以使每个单独的系统更加有效。这并不全是关于更多的测试。这是关于更好的测试和更智能的测试。“。

这需要一种更综合的方法,但潜在的回报是巨大的。Advantest America的总裁兼首席执行官道格·莱费尔(Doug Lefever)说:“如果你无论如何都要做系统级的测试,那么做最后的测试是没有意义的。”“然后,上游的东西转移到晶圆类,以及介于两者之间的所有东西。如果我们只考虑传统的ATE插入,那将是短视的。你需要一个更全面的视图,包括像虚拟插入这样的东西,你可以从制造厂或之前的测试中提取数据,并将其与RMA或现场的东西结合起来,然后使用这些数据进行基于软件的插入,而不需要任何硬件。我们现在就在关注这一点。“。

数据跟踪也可以扩展到最终用户。美国国家仪器公司(National Instruments)旗下OptimalPlus汽车业务部门副总裁兼总经理乌兹·巴鲁克(Uzzi Baruch)表示:“你可以根据某些特征,将数据一直结合到生产过程中,以追踪汽车中的问题。”“这超出了测试数据的范围。你可以对马达本身进行测量,找出维度数据的根本原因,还可以比较测量结果。“。

但同样重要的是,能够过滤掉对确定设备是否正常工作、异常在哪里并不重要的数据,并将这些数据绘制成图表显示该设备随时间的运行情况。随着设备变得越来越复杂,特别是在有多个电源轨和电压的高级节点上,所有这些都变得更具挑战性。

“有时候你甚至没有意识到这个问题,”巴鲁克说。“汽车的数据必须连接回生产线,以防出现问题。但你也必须筛选出天气数据之类的东西,这些数据与系统的运行方式没有直接关系。如果你在做根本原因分析,你需要相关的数据。“。

解聚问题随着各种不同的进程从SoC中分离出来,这可能会变得更加困难。在最先进的节点上开发芯片的成本不断上升,再加上每个节点的功耗/性能提高不断下降,迫使许多芯片制造商将各种规模不大或不关键的功能卸载到封装中的单独芯片中。

ASE高级副总裁Ingu Yen Chang在最近的一次演示中说,“我们可以创建异构集成,让我们能够将芯片放入一个系统,并放入完全不同类型的芯片-无论是模拟芯片、混合信号芯片、数字芯片,甚至传感器芯片-所有这些都在同一个平台上,实现我们今天看到的这种整体集成转换,”ASE高级副总裁英谷·常(Ingu Yine Chang)在最近的一次演示中说。有各种类型的集成,无论是用于机载光学解决方案的硅光子学,还是试图为高性能计算实现一定功率的电源集成。但是芯片分割可以提高产量,提高集成高带宽存储器的能力,并使用各种IP来降低功耗。“。

所有这些因素都会影响系统的预期寿命。有更少的热量,更少的电路老化,电迁移和其他物理效应的减少,以及潜在的更长的介质和其他薄膜的寿命。但供应链中仍有一些问题需要解决。

Formfactor产品营销总监Alan Liao表示:“具有挑战性的部分是,存储器堆栈由一个客户提供,SoC由另一个客户提供,然后包装厂提供硅插入器,并将所有东西封装在一起。”“只有一个筹码,就可以判断是好是坏。但是,当一个包装厂把A公司的一个芯片和B公司的一个芯片整合在一起时,如果整个包装失败了,那么谁来承担责任呢?因此,您需要获得制定业务模式所需的数据。我们测试内存、SoC和插入器,一旦将它们放在一起,我们就再次测试所有东西。通常情况下,这种情况会发生在考场。他们收集所有数据并进行分析。“。

在复杂的包装中,这说起来容易做起来难。测试侧的压力需要精确。

“如果力量不够,你可能得不到稳定的联系,”廖说。“如果太高,那么所有的颠簸都会坍塌。但要同时测试的颠簸太多了,所以我们正在我们的工厂中寻找先进的MEMS工艺,以生产用于这些功能的探头。这很有挑战性,但到目前为止,从探针卡的角度来看,它似乎还可以。但如果我们继续朝这个方向推进,很可能需要新材料和新工艺。“。

微凸起的问题越来越多。微凸点背后的想法是,可以与芯片建立更多的连接,这反过来又允许更多的信号在不同的芯片之间路由。但凸起也面临着一些与其他类型的伸缩相同的问题。

Ansys的产品营销总监Marc Swinnen说:“微凸点的优势在于,在分辨率非常高的情况下,你可以在芯片A上开始处理,并将其运行到芯片B上,上面芯片提供的逻辑可能比在单个芯片上路由信号更接近。”“这就是我们进行完整3D设计的方向。第一次迭代是凹凸,原则上你可以打碎单个骰子,并有效地将掩模大小增加一倍,或者如果你在芯片的两边都放置凸块,那么可能会是原来的三倍。但可靠性是一个巨大的挑战。存在机械应力和翘曲,存在热失配的可能性。“。

左移、右移和居中管理芯片的整个生命周期所需的一个重大变化是数据在流的不同部分之间自由流动并向外流动,整个循环一直回到系统的架构师那里。

Synopsys的帕特拉斯说:“这不仅仅是芯片何时上市的问题。”“它从设计开始,通过制造,通过测试,提出,并最终在现场。如果你在早期就开始积累信息和理解,这可以在以后的阶段使用。因此,当你达到可追溯性时,如果你分析了设计和制造数据,你就可以进行相关性和基线预测。我们提出的方法有两个基本组成部分。其一是对设备的可见性。因此,监视器和传感器智能地嵌入到芯片中。然后这些监视器和传感器将提供关于正在发生的事情的丰富数据,我们可以提取这些数据。所有这些生命周期的不同阶段--设计、模拟、制造、产量提升、测试、提升优化,然后是实地测试--都提供了丰富的数据,我们可以分析这些数据,并最终在整个生命周期阶段进行反馈。“。

在制造业中越来越多地采用AI/ML可以显著帮助预测设备将如何老化,但其覆盖电路板或封装中的多个元素的范围仅限于可用的良好数据量。

“机器学习对表面缺陷检测真的很有帮助,”CyberOptics负责技术和业务发展的副总裁蒂姆·斯库内斯(Tim Skunes)说。我们正在为我们的MRS(多反射抑制)技术研究各种机器学习算法。我们设计了非常复杂的成像系统,在任何给定的成像系统中,可能有1000个不同的变量可以影响最终的成像性能。所以你的设计是为了可制造性,如何划分公差就变得非常关键。“。

如今,几乎所有主要的设备和工具供应商都在使用某种程度的机器学习,并考虑如何进一步扩展机器学习。

Formfactor的廖说:“机器学习出人意料地进入了我们的MEMS制造工艺和我们的设计过程。”因此,每个探针卡都是为特定的应用或芯片定制的。能够优化探针卡是在晶圆上获得高成品率的关键,我们将大型客户数据库应用于某种类型的应用或设计。他们可以利用我们的库进行机器学习,并发现在过去有10个设计与此相匹配。现在,这是使用我们的设计工具在幕后自动完成的。“。

结论在多个市场中,对可靠性、可追溯性和可预测性的重视程度不断提高。虽然汽车行业是所有这一切的催化剂,但它已经蔓延到其他市场,在这些市场,芯片制造商正寻求充分利用他们在芯片设计方面的投资。让它在该领域过早失败会带来经济后果,无论是通过召回还是更换。

在所有流程步骤中调整所有必要的部件是一项巨大的挑战,这将需要对复杂的全球供应链进行更紧密的整合。如果能够实现这一点,将在业务方面获得巨大的效率,在技术方面可能取得重大进步-以及实现这一转变的一大堆新机会。

相关故障前监控IC异常用于监控内部状态的深入而广泛的专用电路为工程师提供了更深入的分析洞察力Chiplet可靠性挑战确定第三方芯片将如何在复杂系统中工作仍然是一个问题。5/3 nm的可靠性挑战越来越大,新的晶体管、材料和更高的密度正在改变测试范式。让5G系统变得可靠的追求谈判桌上的专家:挑战在哪里,可以做些什么来解决它们。确保HBM的可靠性、可能出现的错误以及如何找到它。