太空探索总是令人着迷的,最近的发展重新点燃了人们对自从上一次人类站在月球上以来从未见过的高度的兴趣。人们争论火星探索和宇宙飞船的特征,就像他们的祖父母在50年前互联网存在时会做的那样。我是一名在航空航天行业工作的电子工程师,所以我对这些东西的技术背景略知一二-我看到这些事情并不是常识,人们对一些设备和决定背后的原因往往有很大的偏差。也就是说,我想谈谈与辐射加固集成电路有关的一些误解,以及它们防止辐射损伤的方法。但是,我警告你,这篇课文将会相对较长。
根本不需要抗辐射芯片。CubeSats用最近商店的芯片就行了,非常普通的联想笔记本电脑在国际空间站上运行没有任何问题,甚至连NASA委托的猎户座星载计算机都是基于商业微处理器的!
卫星不需要计算能力,但它们需要这些神奇的抗辐射芯片,所以它们中的大多数都使用了非常古老但非常坚固的80年代的设计,比如TTL四个NAND门。
一篇补充前一篇论文的论文:在现代工艺节点上不可能达到辐射硬度。电离粒子只会撕裂小晶体管。因此,使用这些TTL与非门不仅是合理的,而且是唯一的途径。
采用绝缘体上硅(SOI)或蓝宝石上硅(SOS)工艺实现抗辐射是必要且充分的。
所有军用级芯片都是防辐射的,所有防辐射芯片都是军用级的。如果你有军用IC,你就可以安全地将它发射到外层空间。
正如人们可以看到的那样,这些观点直接相互矛盾-这使得互联网上的争论变得更加有趣,特别是如果你考虑到它们中没有一个是正确的。
让我们从一个重要的免责声明开始:辐射硬度不是空间和其他类似环境综合设计的圣杯。这只是长长的要求列表中的一堆复选框,通常包括可靠性、寿命、宽温度范围、对静电放电的耐受性、振动等等。在整个生命周期内,任何可能损害可靠功能的东西都是重要的,而且大多数需要耐辐射的应用程序也假定不可能进行维修或更换。另一方面,如果其中一个参数出现问题,最终的系统级设计人员通常可以找到解决办法-收紧温度要求,使用冷备件或额外的保护电路-任何合适的方法。在处理辐射效应时,同样的方法也可以:多数投票、电源电流控制和复位是非常常见的方法,通常都是有效的。但这也经常是当一个全新的抗辐射集成电路是满足任务要求的唯一好办法的时候。
记住,专用系统的开发人员与任何其他开发人员都是同一个人,这一点也很有用。就像其他人一样,他们通常会写满拐杖的代码,为昨天的最后期限做好准备,并希望有更强大的硬件来掩盖他们草率的工作;如果Arduino获得了适当的认证,一些人可能会使用Arduino。同样明显的是,创建需求的人很少真正关心任何限制,他们希望拥有与商业系统相同的功能,但更可靠、更坚固。因此,现代工艺在RADHARD电子产品中非常受欢迎--系统设计者希望拥有大量的DRAM、多核处理器和最先进的FPGA。我已经提到,对于一般的辐射耐受性可能有解决办法,所以商业芯片的使用主要是由于缺乏关于问题本身的数据,而不是问题本身或芯片的商业状态。
抗辐射硬度和抗辐射IC的概念本身就是极大的简化。电离和非电离辐射有许多不同的来源,它们以多种方式影响微电子设备的功能。不同应用对不同条件和不同暴露水平的耐受性是不一样的,所以为近地轨道设计的“抗辐射”电路绝对没有义务在切尔诺贝利或福岛解析碎片的机器人中工作。
电离辐射之所以被称为电离辐射,是因为物质中入射粒子的减速会释放能量,使物质电离。每种材料都有自己的电离和产生电子-空穴对所需的能量。硅是3.6 eV,氧化物是-17 eV,砷化镓是-4.8 eV。能量释放还可以使原子在晶格中的正确位置“移位”(必须转移21 eV才能使硅原子移位)。在一种物质中产生的电子-空穴对可以在集成电路中产生不同的效果。因此,辐射效应可分为四大类:总电离剂量效应(TID)、剂量率效应、单粒子效应(SEE)和称为位移损伤的非电离效应。这种分离有点武断:例如,重离子流的照射既会引起单粒子效应,又会导致总电离剂量的累积。
辐射的总吸收剂量是以称为“rad”的单位来测量的,并带有吸收辐射的物质的指示。1rad=0.01J/kg,它是在给定物质中以基本重量单位释放的能量。格雷,100拉德(或1J/kg)是另一个单位,尽管比较罕见。理解由辐射源释放的相同数量的电离粒子(称为辐射暴露)在不同物质中会转化为不同水平的吸收剂量,这一点在某种程度上是很重要的。硅IC的首选材料是氧化硅。这是因为SiO2中非常低的空穴迁移率会导致氧化物中的电荷积累,从而产生各种总剂量效应。商用电路的典型剂量水平在5-100kRad(SiO2)的范围内。根据芯片用途的不同,某些实际应用所需的电平起始值约为30krad(SiO_2),远至几个梯度(SiO_2)。是的,吉加拉德。人类的致死剂量约为6格雷。
TID效应主要与介质中正电荷的积累有关。它们在CMOS电路中主要有几种表现方式:
阈值电压漂移。对于n沟道晶体管,阈值通常会降低(但这种依赖性可能是非单调的,特别是在高剂量时),而对于p沟道晶体管,阈值会增加。移动量与栅氧化层厚度相关,并随工艺节点的增加而减小。在旧技术中,当n沟道晶体管停止关闭和p沟道晶体管停止打开时,n-MOSFET阈值漂移会导致功能故障。这种效应在亚微米技术中不那么重要,但它仍然会给模拟设计者带来很多令人头疼的问题。
在隔离氧化物时,漏电流流过由过量电荷打开的寄生沟道,或者从同一器件的源极到漏极,或者从一个晶体管到另一个晶体管。在第一种情况下,由总剂量控制的寄生晶体管与主晶体管平行形成。这种效应的严重程度高度依赖于技术,因为孤立的氧化物物质的确切形状。因此,没有与过程节点的直接关联,也没有很好的方法来猜测哪种商用设备的TID硬度会更好或更差。
由于散射在累积缺陷上,载流子迁移率降低。这一因素对硅基亚微米数字电路的影响不大,但对功率晶体管(包括
由寄生边缘晶体管引起的1/f噪声增加。它对于模拟和射频电路很重要,当其他TID效应的影响逐渐减小时,在较低的工艺节点变得更加重要。
简单介绍一下双极子:主要的TID效应是由于漏相关的基极电流增加而导致增益降低。另一种双极特异性效应是它们对低速剂量收集的(非强制性)粗糙反应,即所谓的增强型低剂量率敏感性(ELDRS)。这种效果使测试变得复杂,并使其成本更高。最糟糕的是,许多CMOS电路包含几个双极子(即在电压基准电路中),因此也很容易受到影响。
与剂量率相关的另一个影响是,当剂量积累太快,以至于产生如此大量的电子-空穴对,以至于芯片中的每个节点都溢出了巨大的过量电荷,并导致暂时的功能损失,有时还会导致电源和接地之间的寄生晶闸管的闭锁。不起作用的时间通常是衡量这种影响的敏感度,它通常出现在像MIL-STD-883这样的军事标准中。
总剂量率效应是“蓝宝石上硅”(SOS)和“绝缘体上硅”(SOI)技术创造和采用的原因:减少电离粒子流注入有源器件的电荷量的最佳方法是切断它们与极大的衬底(以及彼此之间)的电气连接。为什么这些影响很重要?短时间内极高的剂量率是核爆炸的典型后果,世界各地的军人对此深表关注。对我们来说幸运的是,SOI被证明在许多其他应用中具有优势,因此在日常生活中得到了广泛的应用。
单粒子效应(请参见)与单个电离粒子撞击产生的可测量效应相关。它们可以分为两大类:
非破坏性事件包括各种存储元件(高速缓冲存储器单元、寄存器文件、FPGA配置存储器等)中的位翻转或翻转(SEU)。以及组合逻辑和模拟电路中的瞬态电压尖峰(SET)。这些效应的主要特点是它们不会导致芯片的物理破坏,并且可以通过软件或硬件进行校正。此外,在任意短时间之后,单事件瞬变可以自我校正。存储器中断是这些影响中最为人所知的,因为由于现代数字IC中的巨大存储量,它们构成了故障的很大份额。
破坏性事件有单事件闭锁(SEL)效应和各种较罕见的灾难性故障,如晶体管烧毁、栅极破裂。它们的显著特征是,如果发生这种情况,那么它们是破坏性的,并且对芯片造成不可逆转的损害。闭锁的具体情况是不同的,因为非常快的断电可能经常(但不总是!)。省省芯片吧。电源电流监测和循环电路作为闭锁保护措施相当流行。其他破坏性影响在CMOS电路上并不常见,但对某些类型的闪存和高压设备(包括电源开关)来说是一个严重的威胁。
图1.单粒子效应率的实验数据。摘自J.Barth等人,商业SRAM和功率MOSFET上的单粒子效应:APEX上CREX飞行实验的最终结果,NSREC辐射效应数据研讨会,1998年。
请看图1,可以看到最坏的情况大约是每200天就有一次意外……。每一位。是的,记忆中的每一点都会受到每年两次的影响。但是,当我们有兆位或千兆字节的内存时,它总是会受到影响,对吗?是的,这是一个问题,有一些技术可以解决这个问题,但稍后会详细介绍。
电离粒子撞击的比能量产额称为“线性能量转移”(LET),测量单位为(MeV*cm^2)/mg。LET非线性和非单调地依赖于粒子能量,还与路径长度有关,对于相关的粒子和材料,路径长度可以从数百纳米到数百毫米不等。基本上,大多数电离粒子只是穿过IC然后飞回外层空间。低能粒子在真实的太空环境中更为常见(参见图2)。重要的Let值是30(对应于铁离子)和60/80(通常被认为是要考虑的最高Let值)。另一个重要的数字是15 MeV*cm^2/(Mg)-硅原子与质子或中子之间核反应产物的最大LET。质子很重要,因为它们构成太阳辐射的重要组成部分。虽然他们自己的LET很低,但上述核反应的概率很高,足以造成许多事件,特别是在范艾伦带或太阳爆发期间。质子也可以与较重元素的原子核相互作用,如钨(用于接触)或钽(流行的抗TID屏蔽材料)。这种次要影响是第二个最重要的原因,那就是不要为了增加芯片的辐射强度而将你的空间芯片封装在led盖中。顺便说一下,第一个是每公斤的投放价格。
同样值得注意的是,氦核(阿尔法粒子)是单粒子效应的来源不是因为太阳辐射中有一些,而是因为在日常生活中可以找到大量的阿尔法源,比如led焊料和一些集成电路封装材料。如果你听说过低阿尔法凹凸和底填-它是关于与航空航天无关的“平凡”应用中的单一事件缓解。
图2。在为期两年的太空任务中发现的一些不同的粒子。引用自:Xapsos等人,“累积太阳重离子能量和线性能量转移谱模型”,IEEE核科学学报,第5卷,第6期,2007年。
1、30或60 MeV*cm^2/(Mg)-多少钱?在7 nm工艺下,标准SRAM存储单元的翻转阈值远低于1,而在180 nm工艺下,翻转阈值可以从1到10变化。使用特殊的原理图可以将阈值提高到100,但通常更明智的做法是达到15或30,其余的通过纠错码实现。60 MeV*cm^2/(Mg)最常出现在破坏性事件的要求中-以确保芯片极有可能在其全部预期寿命内存活。
位移效应是由于原子在其预定位置被击倒而造成的晶格的局部破坏。这通常需要相当高的能量,所以大多数辐射粒子不会引起这种效应。然而,二次辐射可以,而且太空中有大量的质子。这些局域晶格缺陷降低了载流子的迁移率,增加了噪声,并造成了一些其他损害。由于它们的地域性,它们通常不会对传统的cmos芯片产生重大影响,但它们在太阳能电池、光电探测器、功率晶体管和其他基于化合物半导体的设备(如砷化镓和氮化镓)中占据主导地位。化合物半导体中的晶体管通常不是MOS,而是JFET或HEMT,所以它们没有栅氧化物。这就解释了它们的高总剂量耐受性-它们根本不会受到导致CMOS芯片快速退化的影响。然而,位移效应在这些新材料中要明显得多,因此应该适当地考虑和加权。
当我们完成对效应的描述时,让我们看看它们在哪里以及如何威胁集成电路。
图3.在1g/cm的屏蔽下,卫星寿命十年的总电离剂量计算2.改编自N.Kuznetsov,";卫星空间轨道和行星际轨道上的辐射危险(俄文)。
图3显示了不同轨道的总电离剂量计算实例。这里有多个假设-包括太阳活动、形状、材料和保护层厚度,但你可以得到这样的想法:在不同的轨道上,剂量率可以有五个数量级的变化。在第一个范艾伦带下面的低轨道上,剂量被吸收得如此之慢,以至于许多现成的商业芯片可以在这种条件下承受数年,就像国际空间站的笔记本电脑一样。甚至更脆弱的人可以在那里飞行数年,而不会对健康造成严重影响。低轨道极其重要,因为它们涵盖了整个载人航天、地球遥感、许多现在的通信卫星和未来的空中互联网星座。最后但并非最不重要的一点是,几乎所有立方体卫星都发射到低轨道。
事实上,低轨道的重要性是多种猜测的根源,即根本不需要昂贵的抗辐射芯片,如果不被过于保守的行业拒绝,COTS可以做任何事情。是的,COTS可以做一些体面的工作,但也有一些陷阱,即使在低轨道上也是如此。
范艾伦带只保护地球不受轻粒子的影响,主要是太阳电子和质子。更重的粒子,即使它们要罕见得多,也会悄悄地到达我们最后的盾牌-大气-并产生单一效应,包括灾难性的闭锁,能够在任何时候不可逆转地摧毁任何芯片。因此,商业芯片只有在以某种方式防止闭锁的情况下才能使用,否则可能会丢失整个航天器。
另一个问题是,太空中使用的芯片不仅仅是处理器和内存,还有许多其他类型的芯片,包括电源和模拟芯片。非逻辑电路的辐射耐受性要复杂得多,研究得更少,也更难预测。此外,现代SoC还包含大量的非数字模块,如PLL、ADC、I/O电路等。例如,闪存总剂量故障的最常见原因是用于存储器写入的高压发生器。模拟电路的失调增加,微小的漏电会严重影响低功耗模拟电路的功能,功率晶体管正在经历击穿电压退化等问题。
同样重要的是要记住,辐射敏感性对工艺变化很敏感,有时甚至是很小的变化。因此,如果工厂改变了一些氧化物生长的温度,你可以把辐射测试结果扔进垃圾桶。商业供应商从不保证同一产品的不同批次会有相同的晶体,生产过程会在一段时间内保持稳定。IPhone6的处理器Apple A9同时在16纳米的台积电和14纳米的三星晶圆上生产,用户没有资格知道具体的手机内部是哪个版本。不幸的是,这种方法对于高可靠性的电路是不可能的,这就是为什么radhard芯片经常在一些可信的铸造厂或至少在汽车专用工艺上生产,因为汽车行业也关心可靠性,需要稳定的技术。
然而,卫星并不只在低轨道上飞行。我将以“Molniya”轨道为例,说明非常不同的要求。这个轨道是以最先在那里的一颗苏联卫星命名的。“那里”有一个极地轨道,最小高度在500公里左右,最大高度在40000公里左右。轨道周期为12或24小时,卫星大部分时间都在远地点附近,充当一个伪静态物体,为看不到地球同步卫星的极地地区提供通信。
第一颗莫尔尼亚卫星的寿命非常短,只有几个月。主要原因是为无线电传输供电的太阳能电池板退化。
.