ISO9001
图片展示

功率器件功率循环测试技术的挑战与分析

发表时间: 2023-03-27 13:04:55

作者: 华北电力大学

来源: 中国电机工程学报

浏览:

半导体在线
1 引言
功率半导体器件,尤其是绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor, IGBT),一直是新能源、轨道交通、电动汽车、工业应用和家用电器等应用的核心部件。硅基 IGBT 器件由于驱动功率小和饱和压降低,而且具有电压等级高(高达6500V)和电流范围广(高达 3600A)的优势,成为各个领域的中流砥柱[1]。高工作结温、高功率密度和高开关频率是实现电力电子装置小型化的必要手段 和 未 来 的 重 要 发 展 方 向[2]。宽 禁 带 器 件(如Silicon Carbon Metal-Oxide-Semiconductor FieldEffect Transistor, SiC MOSFET)具备高击穿场强、高工作结温和高开关频率的特点[3], 因此得到重点关注,尤其是近些年在电动汽车应用驱动下得到前所未有的全面、 大力和高速发展[4]。可靠性成为继器件特性表征外最重要的质量评估手段和发展目标,也是近几年国内研究机构和应用方最为关注的研究领域。
功率循环测试是通过外部负载电流通和关断来模拟器件实际应用的结温波动过程,并通过一定程度的加速老化(前提是器件失效机理不能变[5])以提前暴露器件封装的薄弱点[6]。一直被工业界和学术界认为是考核功率器件封装可靠性最重要的可靠性测试,也是进行器件寿命模型建立和寿命评估的根本[7]。因此测试结果的准确性相当重要,测试方法和测试技术的不同将导致不同的测试结果,降低结果的有效性和公证力。为了规范此测试,欧洲电力电子中心相继在 2018 年和 2021 年发布了 AQG324 标准[8],专门针对电动汽车用功率模块的功率循环测试进行了定义和规定。尤其是2021 年发布的版本更是增加了对 SiC MOSFET 的相关测试要求和细节,包括结温测试方法。
功率循环考核的主要是器件不同封装材料界面的热膨胀系数(Coefficient of Thermal Expansion,CTE)不一致在往复周期性结温波动激励下的老化。因此, 封装材料 CTE 不匹配是限制器件寿命的根本原因, 结温波动 ΔTvj和最大结温 Tvjmax是激励源,而测试过程中的其他因素将会直接影响结温的变化和测试结果。如标准中[8]规定负载电流开通时间 ton 小于 5s(称为秒级功率循环)考核的是芯片周围的连接处,而 ton大于 15s (称为分钟级功率循环)考核的则是远离芯片的连接处。进一步地,被测器件关键老化参数的准确在线监测(如 IGBT 器件饱和压降 VCE和热阻 Rth)也是至关重要的,将直接影响器件的失效模式判定和寿命。可见,测试条件和细节均将对测试结果、甚至是器件的失效机理产生影响。
随着 Si IGBT、 SiC MOSFET 与电动汽车的双向持续推动发展和深入研究,国内外越来越多的学者和企业对功率器件的可靠性测试表达了高度关注,尤其是功率循环测试。与其他可靠性测试不同的是,功率循环测试原理虽然简单,但测试技术、测试方法和测试细节却涉及到半导体物理、电磁学、传热学、结构力学和信号分析等多学科交叉,处理不当将得到错误的结论。因此, 对测试设备的测试技术、测试方法和测试人员均提出了很高的挑战。
本文将针对功率循环测试需求、现有功率循环设备的关键技术和方法、测试标准的相关要求,结合团队 8 年来在功率循环测试技术、失效分析和测试设备等方面相关研究基础以及国内外研究现状, 对功率循环测试技术存在的挑战从基本原理上进行深度剖析,并在此基础上提出未来的发展方向。可以为功率循环测试技术和设备的发展奠定理论和方法基础,为功率循环测试和数据分析提供指导。
2 功率循环基本原理
功率循环的基本电路原理图和温度变化曲线示意如图 1 所示[9](不作特殊说明外,本文均以IGBT 器件为例)。负载电流通过外部开关的控制给被测器件施加一定占空比(ton/(ton+toff))的电流 ILoad以加热器件达到指定最大结温 Tvjmax;为了使得器件的热量及时散走和降低结温,一般将被测器件安装在可恒定温度的水冷板上。在切断负载电流后器件的结温降低到最小结温 Tvjmin,以此周期往复达到考核器件封装可靠性的目的。因此,在一个循环周期内(ton+toff),被测器件加热时间或者电流开通时间为 ton, 电流关断时间或降温时间为 toff。而测量电流 ISense 则是一直加载在被测器件的两端,用于实现器件结温的电学参数间接测量,一般选为器件额定电流的 1/1000 [10]。这里要说明的是,测量电流的选取对结温测量是有很大影响的,不能过大引起自发热现象,也不能过小,没有形成稳定的导流通道和电压[11]
AQG324 标准中明确规定了功率循环过程中要实时监测被测器件的正向或饱和压降 VCE、 结温差ΔTvj (Tvjmax-Tvjmin)和热阻 Rthj-x, 其中 x 代表参考点的温度。热阻计算公式如(1), 根据参考点不同,可以分为结到壳热阻 Rthj-c、结到散热器热阻 Rthj-s和结到环境热阻 Rthj-a。器件的结温 Tvj 一般采用电学方法,如小电流下饱和压降法 VCE(T)[10]间接获得,参考点温度 Tx 则是通过热电偶获得,功率 P则是通过大电流饱和压降 VCE 和负载电流 ILoad 计算。因此,在功率循环测试过程中主要进行三个参数的准确测量:小电流下的饱和压降 VCE(T)、大电流下压降 VCE和热电偶的温度测量[12]。
器件的饱和压降 VCE 和热阻 Rthj-x 分别用来表征键合线和焊料的老化状态,进一步还可以获得器件的寿命和失效模式。标准规定当饱和压降 VCE达到初始值的 105%或者热阻 Rth 达到初始值的120%认定为器件失效[8]。如下图 2 所示为两个不同封装形式的 1200V, 25A 器件在功率循环老化过程中三个关键参数(VCE、 Rthj-x 和 ΔTvj)与功率循环次数 Nf 的关系。测试条件均为开通时间 ton=1s,降温时间 toff=2s, 栅极电压 VGE=15V, 结温差ΔTvj≈90K, 最大结温 Tvjmax≈150℃。需要说明的是,本文中所有未引用的图均为团队实际功率循环测试结果以用作示意。
图中结果可看到, 器件的关键参数在功率循环老化前期均比较稳定,呈现缓慢上升趋势,这一般是裂纹的形成过程,直到功率循环后期,呈现指数上升趋势后短时间内即达到失效标准。图2(a)可以看到器件的饱和压降和热阻随着功率循环次数均存在一定程度的增加,说明器件的键合线和焊料有一定的老化,使得结温也逐渐升高,加速了老化进程。但最终器件的结到散热器热阻先达到失效判定标准,为焊料老化失效。而图 2(b)展示是的 TO 封装器件的结果,表现为键合线失效(饱和压降升高,热阻几乎不变)。
由功率器件的寿命模型[13-15]可知, 结温差ΔTvj是影响器件寿命最重要的因素, 其次是绝对温度如最大结温Tvjmax。进一步地,器件热阻准确测量的关键也取决于结温,因为功率和热电偶的测量相对比较成熟。可见, 结温的准确测量成为功率循环测试最为关键的技术,但归根结底还是取决于电压的测量, 这也是功率循环测试技术最大的挑战和难点之一。后面将从功率循环测试技术、测试方法和数据处理等三个大方面对功率循环测试技术存在的挑战进行基本理论分析。
值得一提的是, 目前所有标准[8][16][17]中定义的均为直流功率循环(Direct Current, DC),也就是电流激励为直流。因此,被测器件只有导通损耗,而没有开关损耗,同时也没有阻断时高电压作用。近年来部分研究机构开始关注更贴近工况的交流或PWM (Pulse Width Modulation)功率循环[18-22],也就是将被测器件放置在实际应用拓扑中来达到加速器件老化过程,通过被测器件的电流为PWM波。一方面被测器件在主动关断时承受实现电路的高电压作用,另一方面器件的损耗一部分来源于开关损耗,一定程度上可降低测试电流,减少键合线的自发热现象,进而减小键合线的热应力。但PWM功率循环电路结构和控制复杂,使得结温准确测量成为难点,同时,高频开关产生的干扰也会影响结温的测量精度[23]。
功率循环测试通过加速器件老化过程以考核封装可靠性,因此最需要关注的是器件失效机理和寿命,文献[24]己全面归纳总结和分析了现有所有公开发表的关于DC与PWM功率循环资料。结果表明,器件经过PWM功率循环老化并没有出现新的失效机理,仍然是DC功率循环最常见的键合线失效、焊料老化和表面金属化三种现象[25]。进一步地,同一批器件在近乎相同的功率循环测试条件下,两个不同电流激励得到的功率循环寿命是没有差异的。而DC功率循环一直以电路结构简单,结温测量方便等被各研究机构和标准广泛采用,仍会是未来的重点。因此,本文后续关于功率循环测试的挑战和分析均是基于DC功率循环展开。
3 测试技术
功率半导体芯片的电气响应时间一般是 µs 甚至是 ns 级, 如 IGBT 电子和空穴的寿命分别为80µs 和 1µs,而二极管是 6µs 和 0.6µs [26]。同时热量在芯片内热传递时间也是 µs 级, 而器件特性和关键参数的测量几乎均是通过电气参数的准确测量而获得的,如结温是通过小电流下饱和压降法。因此,实现被测器件高频、高精度和抗干扰的准确测量是功率循环测试技术面临的一大挑战。

3.1 电气测量噪声

图 1 的功率循环基本电路图可看到,整个电气回路虽然简单,但也涉及连接线路的结构、回路和母排精细化设计,最大限度的减小整个回路的寄生电感 Ls。功率循环测试中,一般需要在极短时间内,如美国商用功率循环设备提出 1µs 内将通过开关将负载电流切除[27]。寄生电感的存在则会在电流关断时产生过电压 U=Ls*di/dt, 尤其是大 功 率 模 块 , 需 要 切 断 的 电 流 较 大 时 , 如4500V3000A 压接型 IGBT 器件。这个过电压作用在控制开关和测量电流源两端, 不仅影响了控制开关特性,更重要的是影响测量电流源的输出能力和稳定性。有研究表明,测量电流源的稳定性很大程度上影响着结温测量的准确性[28]。

进一步地,回路寄生电感和控制开关配合设计还会影响测量回路的抗干扰能力, 任何测量电路均会受到测量噪声的影响, 最大限度的减小其幅值及影响是一个挑战和必须重点关注的点。下图 3 为某 30kW1500A 和 90kW3000A 功率循环测试设备电压测量结果[9, 29] (测量系统电压采样频率为 500kHz)。可以看到,当电流等级较小时,整个回路的设计更紧凑, 电压测量的振荡幅值较小,只有±0.5mV (此案例电压为 0.6265V~0.6275V);而 90kW3000A 测试设备由于电流等级高,被测样品体积大,回路设计复杂等,导致测量振荡达到±4mV (此电压范围为 0.618V~0.626V,主要集中在0.620V~0.624V)。
一般对于硅基器件如 IGBT 而言, PN 结压降的温度敏感关系约为-2mV/℃ [28], 由测量噪声带来的结温测量误差则分别为±0.25 ℃和±2 ℃。结温测量的误差将会直接导致热阻测量结果和功率循环寿命评估存在一定误差。虽然可以通过软件滤波达到一定的效果,但可能会丢失重要的信息,尤其是在短时间结温测量上,后面也会讲到其对结温的准确测量的意义。因此,不建议通过软件滤波以达到高信噪比的效果,推荐通过上述硬件方法实现低测量噪声。

3.2 结温测量延时

功率半导体器件,尤其是 MOS 结构在负载电流切断后载流子复合重新建立电场需要一定的时间[30],这是不可避免的。将从大电流切断到载流子完全复合形成测量电流下的稳定电场所需要的时间称为测量延时 tMD。延时时间 tMD 和被测器件内部芯片的结构、电压等级、工作结温、测量电流大小、测试回路等均有密切关系[26]。下图 4 展示了一个 6.5kV IGBT 在不同电路拓扑(器件主动/被动关断)和不同结温条件下测量延时的测试结果[31]。图 1(a)所示的电路中被测 IGBT 一直处于导通状态, 通过外部开关实现负载电流的开通和关断,称为被动关断。PWM 功率循环是通过控制被测IGBT 的栅极来实现的,称为主动关断。

从这个案例可看到, 不同控制方式会产生很大的影响, IGBT 自身主动关断所需要的延时时间短, 非常有利于结温的准确测量。但小电压流饱和压降法在大电流切断后测结温需要将被测 IGBT导通,与主动关断电路相违背, 需要经过特殊电路设计,使得测量变得更复杂, 并不适用。同时,由于硅材料中载流子的寿命是正温度系数,温度越高,寿命越长,导致的测量延时也越长。如图4(a)展示的结果, 6.5kV IGBT 在被动关断时延时时间分别约为 320µs (@25℃)和 720µs (@125℃)。这在功率循环测试时需要重点关注, 否则将得到错误的结果。
测量延时的选取对功率循环最大结温 Tvjmax 的准确测量具有非常重要的意义,将直接影响器件的测试条件和寿命评估结果。不仅要保证测量延时功率循环初期足够,还要考虑器件老化后导致结温上升而增加的测量延时。若测量延时选取不够或者过小,将会测量到较低的电压值或者干扰,比如图 4(a)中测量延时选取 500µs (@125℃), 而器件在小电流下是负温度系数,通过小电流饱和压降换算的结温则会偏高,甚至在额定电流下会超过 200℃的错误结果。
当然测量延时也不能过大,这是由于芯片结温在测量延时期间是持续下降的,使得测量的并不是芯片降温初期 t=0s 真正的最大结温。图 5 为Si IGBT 和 SiC MOSFET 的结温降温曲线[32],两个器件均为 TO-247 封装,其中仿真用功率密度取自功 率 循 环 实 验 数 据(测 试 条 件为 ton=2s, toff=4s,ΔTj=90K 和 Tjmax=150℃)。可以看到, 测量延时导致的误差不仅和延时时间有关,还和功率密度有密切关系。当测量延时为 100 µs 时, Si IGBT 和SiC MOSFET 的测量误差分别为 5.1K 和 10.7K,若延时时间增加到 500µs, SiC 的误差甚至能到35.1K。
上述提及的测量延时带来的结温误差在功率循环测试中是不能接受的,下图 6 为文献[33]作者基于 CIPS08 寿命模型[14]计算的不同结温测量误差导致的寿命预测误差。假定功率循环测试的条件为 ΔTj=90K 和 Tjmin=25℃, 结温测量误差为-5K(即图 5 的 Si IGBT 器件 100µs 带来的误差),将产生 27%的寿命评估误差。进一步地,基于此寿命模型进行实际工况的寿命预测时,工况条件要小很多,如电网用器件的结温波动一般小于 20K [34],那么此时的寿命误差将高达 168%。值得注意的是,电网实际的最低结温一般高于 60℃, 而且所用模块基板为 AlN,所以上述误差只供参考。
因此,测量延时的问题在功率循环测试是必须要重点关注的,对测试设备在测试回路、 采样频率和数据处理方面均提出了挑战。1)测试回路方面:应该全面考虑降低寄生电感、增强抗干扰能力和快速控制开关的联合设计。一方面提高测试回路的信噪比,另一方面尽可能减少测试回路对测量延时的影响;2) 采样频率方面:设备要具备足够高的采样率和抗干扰能力, 至少要达到50kHz 及以上的采样频率,也就是说每个采样点最多是 20µs 以保障足够的数据点和精度。同时,采样频率也不必要过高,这是由于测量延时的存在,过高的采样也没意义,如 1MHz [27]。一般低压器件的基区薄,测量延时小,但对于功率器件(电压大于 600V)一般达到 50 µs,甚至 100 µs 以上。因此, 建议的采样频率选择为 100kHz 左右比较合适;3)数据处理方面,测试设备必须具备测量延时点的显示窗口,以便于在功率循环前查看并确认相应的测量延时。如前所述,影响测量延时的因素有器件自身的,也有测试电路和测试条件的[26],需要根据具体情况确定。

3.3 数据采集点

上两节讲述的是实现功率循环数据准确采集,尤其是结温的准确测量所面临的挑战,需要的是高精度采样、精密化回路和抗干扰设计等。采集的数据点及其表征物理意义,或与器件老化状态的关联关系成为功率循环测试技术另一个挑战,也将直接影响器件的失效模式判定。前面己经提到,在功率循环过程中通过器件大电流下的饱和压降 VCE 来表征器件键合线的连接状态, 热阻 Rth来表征焊料的连接状态[8]。器件饱和压降不仅包括芯片自身压降,还包括键合线以及外部连接电阻产生的压降[35],如公式(2), 且芯片压降是电流和温度的函数,其中 Rconnect表示 IGBT 模块中除键合以外的电阻。现有公开发表的绝大多数文献 [36-38]和所有商业功率循环设备均是在大电流关断前进行饱和压降的测量以表征键合线的老化状态。
????????????(????, ????) = ????????ℎ????????(????, ????) + ???? ∗ (???????????????????? + ????????????????????????????????) (2)

模块老化后键合线电阻或者芯片表面与键合线接触电阻的增加导致 VCE的升高, 但随着模块的老化,器件的功率增加,结温也随之升高,由于IGBT 芯片大电流下的正温度特性,最终也会导致VCE 升高。因此,在功率循环测试过程中测量得到的 VCE升高分别来自键合线自身老化和老化后结温升高,很难解耦并判定键合线的老化程度。文献[39]提出了一种温度补偿方法, 通过提前校准被测器件在不同电流和温度下的关联关系,然后在测量过程中进行补偿。校准过程相对复杂,在功率循环测试过程中的实现难度大,而且只适用于由于焊料等传热路径变化导致的结温补偿。
为了解决这一问题, 文献[9, 40-42]额外增加了一个测量点,在负载电流开通后和负载电流关断前瞬间均采集器件的饱和压降,如下图 7 所示。单个功率循环周期共有 4 个测量点:a 点是负载电流开通前瞬间,此时器件被冷却至最低温,定义为cold 状态,测量最小结温 Tjmin和最小壳温 Tcmin;b点是负载电流开通后瞬间,从开通到电流稳定只需要 µs 级时间,此时器件并没有被加热,也定义为 cold 状态,测量负载电流 IL(cold)和饱和压降VCE(cold);c 点是负载电流关断前瞬间,此时器件被完全加热至最高结温,定义为 hot 状态,测量负载电流 IL(hot)和饱和压降 VCE(hot);d 点是负载电流关断后瞬间,器件认为没有被降温, 也定义为 hot 状态,测量最大结温 Tjmax和最高壳温 Tcmax
如 3.2 所述,实际上 d 点的选取也很关键,因为在这个延时时间内器件会有一定程度的温度降低,测量得到的并不是真正的最高结温。同时,测量得到的 VCE(hot)一定比会 VCE(cold)大,这是因为VCE(cold)表征的是器件在最低结温时的压降,而VCE(hot)表征的是在最高结温时的压降。在功率循环老化过程中, Tjmin 受到水冷的控制,几乎不会变化,也不受测量延时的影响,而 Tjmax 由于器件老化的影响,会持续增加(如图 8(a))。因此,若采用c 点的饱和压降来表征键合线老化就会耦合温度的影响, 无法直接判定键合线老化程度,甚至得到错误的结论, 而 b 点只受键合线老化的影响。器件热阻的计算则需采用 c 点的电流 IL(hot)和饱和压降 VCE(hot),表征的是器件抵抗热量传热的能力。图 8 展示的是 4 个 1200V, 25A IGBT 器件在功率循环老化过程中的变量变化趋势,测试条件均为 ton=5s, toff=10s, VGE=15V, ΔTj≈90K, Tjmax≈150℃。
可以看到,在功率循环老化过程中,器件的最小结温几乎保持不变,而最大结温随着老化的进程而逐渐增加,前期相对平缓,到了寿命后期呈现近指数增加的趋势。图 8(b)和(c)展示的器件在 b点和 c 点的饱和压降, 也就是对应器件最小结温和最 大 结 温 状 态 , 功 率 循 环 初 期 分 别 为 2.16V(@60℃)和 2.48V (@150℃)。随着老化的进程, 饱和压降均呈现了上升趋势,最终涨幅约为 90mV和 180mV。
单从 VCE(hot)升高是无法判定键合线失效的,也可能是由于焊料老化导致的结温升高,最终使得电压升高。而 VCE(cold)的升高一定是由于键合线的老化(90mV), 另外的 90mV 则是由于键合线或焊料老化(需要根据图 8(d)的热阻变化趋势判定)导致的结温升高而增加的。图 8(d)可以看到,结温差的变化趋势与热阻变化趋势几乎一致,这是因为结温的升高主要来源于热流路径老化后的热阻增加。VCE(hot)的变化趋势几乎与结温差一致(最小结温不变, Tjmax=Tjmin+ΔTj), 也侧面说明了 VCE(hot)很大程度上受到最大结温的影响。VCE(cold)几乎与结温差无关,呈现缓慢增加趋势,表明键合线发生了一定的老化。
IGBT 器件在功率循环过程一般会同时发生键合线和焊料老化, 而且还存在“竞争失效”机制[42],图 8 也展示了此现象。焊料的老化严重影响了散热路径,很大程度上使得最大结温升高,最终影响 c 点饱和压降。只监测 c 点饱和压降 VCE(hot),并用来判定键合线的连接状态,从图 8(c)和(d)可看到, FS25-05 压降涨幅约为 180mV,超过了 5%的失效判定标准。此器件很可能被误判为键合线失效,而实际是键合线和焊料均发生了不同程度的老化,且热阻 Rthjs 达到 20%的失效判定标准。因此,数据采集点的正确选取对功率循环测试结果,尤其是寿命和失效模式的判定非常重要。进一步地,通过图 7 所示 b 点的 VCE(cold)判定键合线老化状态和和 c 点的 Rthjs判定焊料的老化状态可以直接分离器件的失效模式。通过测量器件功率循环老化前后的瞬态热阻抗曲线 Zthjs, 并转换成可表征器件内部各层材料热阻热容关系的结构函数可更加直观的判定和定位失效界面[43]。
4 测试方法
在突破了上述测试技术后,功率循环测试还需要重点关注不同测试方法带来的误差甚至是导致的错误结果。
4.1 结温测试方法
通过上述分析可知,结温的准确在线测量是功率循环测试中最为重要的,直接影响测试结果和结论。文献[44]对比总结了各类结温测量方法的一致性、线性度、灵敏度、实现难易程度以及代表的物理意义,基于通态特性的电学参数法更适用于器件导通状态的测试。国际电工技术委员会IEC 标准[16]也指出在功率循环、热阻或瞬态热阻抗测试中可采用小电流阈值电压 VGE(th)(T) 法(后文简称 VGE(th)(T)法)或小电流饱和压降 VCE(T) 法 (后文简称 VCE(T)法)进行结温的测量。虽然这两种方法得到的温度均可近似看成芯片表面平均温度[45][46],但实际上表征的物理位置是不一样的,VGE(th)(T)法表征的是发射极侧沟道区的温度,而VCE(T)法表征的是集电极侧 PN 的温度。在小功率或低压器件领域(如 60V 以下),芯片电压等级低,基区很薄,这种方法测量得到的温度差异很小;而对于功率器件(一般是 600V 及以上),电压等级高,芯片基区厚度的增加使得差异增加。
下图 9 为 IGBT 芯片的结构示意图[46],这种位置上的差异使得 VGE(th)(T)法测得的温度必然比VCE(T)法大,而且随着电压等级升高而增大。这是由于 IGBT 芯片工作时产生的热量几乎从集电极侧散走,使得芯片内部存在纵向温度梯度。IGBT 芯片电压等级越高,基区越厚,纵向温度梯度越大,两种方法的差异就越大。正是由于这种差异,不同研究机构在功率循环过程中采用不同的结温测量方法将带不同的结果,不便于测试结果的共享和对标。AQG324 标准[8]规定了功率循环测试中必 须 采 用 VCE(T)法 进 行 结 温 测 量 , 但 不 代 表VCE(T)法 就 一 定 比 VGE(th)(T)法 更 好 , 实 际 上VGE(th)(T)法在某些场合的适用性更强。下面将从两个方法的测试电路原理图、实现难易程度和优缺点等方面全面对比,便于读者可根据自己的需求选择合适的方法。图 1(a)展示的即是 VCE(T)法的电路图,不需要改变功率循环主测试回路和被测 IGBT 状态,被测 IGBT 两端施加一个小电流源。只需要通过外部辅助开关来实现主回路负载电流的切换,监测被测 IGBT 两端电压即可获得器件饱和压降和结温,实现简单。下图 10则是 VGE(th)(T)法在功率循环测试中的实现电路[45]示意图, 需要额外增加 2 个辅助开关来实现相应的控制时序。功率循环加热阶段,需要将被测IGBT (S2 开通, S3 关断)开通,同时打开 S1 让负载电流加热器件;降温阶段,需要关断 S1 切断负载电流,同时将被测 IGBT 器件转换到阈值电压模式(S2 关断, S3 开通)实现结温的测量。可以看到,VGE(th)(T)法不仅电路结构复杂,控制时序也相对较复杂, 测量延时的选取也很关键。同时,必须在栅极和发射极两端并联一个合适阻值的电阻,如图中的 330kΩ 电阻提供栅极放电回路, 以消除对测量延时的影响。
从图 10 还可看到, VGE(th)(T)法和 VCE(T)法一样,在最大结温测量过程同样需要一定的测量延时 tMD,一方面是时序控制的需要(如图 10(b)),另一方面是载流子复合仍需要时间。因此,不管哪种结温测量方法,必然存在一定的测量延时,器件的最大结温也必然会降低,而带来一定的测量误差。针对这种情况, JESD51-1 [47]标准提出了用根号 t 法来修正这段由测量延时带来的测量误差,此方法的前提条件是热量在同一材料内可近似看成一维单向热传导问题,降温曲线与时间的根号为线性关系[48]。通过测量的降温曲线,线性反推即可获得芯片在 t=0 时刻的最高结温。
在功率半导体器件领域,需要满足上述物理关系或前提是发热源必须为面热源,如二极管和MOSFET,而 IGBT 芯片在导通状态时的热源主要来源于沟道、基区和集电极 PN 结,属于体热源[49]。进一步地,由图 9 可知 VCE(T)法测量的实质上是芯片下表面的温度,更加使其不严格满足根号 t 法的前提条件,而带来一定的误差。当然,此误差与器件的功率密度和电压等级等均有关系,下图11 为根号 t 法在不同电压等级、有源区面积、功率密度条件下的误差[50]。
图11 不同电压等级和有源区面积测量误差的综合对比
因此, VCE(T)法应用在二极管或者 MOSFET时,测量延时带来的最大结温误差可近似用根号 t法进行修正;而应用在 IGBT 时,根号 t 法仍然存在一定程度的偏差[32]。同时,这种偏差还会导致器件瞬态热阻抗曲线测量的偏移,最终影响器件结到壳热阻 Rthjc 的测量精度[51]。虽然可通过其他方法,如有限元仿真等进行修正达到高精度[32],但实现难度大、流程复杂, 尤其不利于在功率循环测试过程中进行在线修正。这是目前 VCE(T)法应用在 IGBT 器件上的最大的缺点,也是在功率循环测试过程中必须要重点关注的问题。VCE(T)法最大的优点就是在功率循环测试中实现简单,而且此参数不受器件封装老化的影响,可非常准确的表征器件结温信息。
从原理和图 9 来看, VGE(th)(T)法表征的是芯片上表面沟道温度, 虽然 IGBT 芯片为体热源,但测量表征的是芯片上表面温度, 使其相对符合一维单向热传导条件。因此,根号 t 法应该相对适用于VGE(th)(T)法测量得到的结温曲线。下图 12 为某1200V, 25A 器件和 6500V, 750A 器件通过 VGE(th)(T)法测量得到的降温曲线, t=0s 时刻的最大结温Tjmax1 是通过有限元仿真获得(被认为基准值),Tjmax2 则是 VGE(th)(T)法通过根号 t 反推得到, Tjmax3则是 VCE(T)法通过根号 t 反推得到。可看到, 对于低压器件(1200V),基区很薄, 三个值相差很小,且 Tjmax1>Tjmax2>Tjmax3;对于高压器件(6500V),基区很厚, 三者差异相对较大,且 Tjmax2 更贴近Tjmax1。因此, 对于 VGE(th)(T)法测量的结温曲线,可通过根号 t 法来近似修正以简化过程。这种意义上来说, VGE(th)(T)法虽然电路复杂,但适用性更强。此方法的另一个优点就是灵敏度高,一般约为-10mV/℃, 相 比 VCE(T)法(一 般 硅 器 件 约 为-2mV/ ℃)高 5 倍。
和其他温敏参数一样, VGE(th)(T)法最大的缺点在于此参数会受到器件老化的影响[45],使得结温测量在老化后产生误差。在功率循环测试周期中,IGBT 器件栅极一般施加+15V 的电压,老化后会使得阈值电压产生正偏移(30~100mV),从而导致3~10K 的结温测量偏差。进一步地,某些器件在功率循环老化后,键合线的抬起也会破坏器件的栅氧结构, 从而使得 VGE(th)(T)法失效。但实际上此时器件己经达到失效了,再进行结温的测量也是无意义的,因此,这种情况对功率循环测试的影响可忽略。
从前述可知,评估功率器件寿命最重要的参数是功率循环初始条件结温差 ΔTj 和最大结温Tjmax, 并 不 考 虑 老 化 后 结 温 参 数 的 变 化 , 而VGE(th)(T)法测量的结温在老化前不会产生偏差。进一步地,功率循环测试需要监测的最重要三个参数为结温差 ΔTj, 饱和压降 VCE 和热阻 Rthjs。而ΔTj=Tjmax-Tjmin, VGE(th)(T)法在老化后产生的偏差同时存在于 Tjmax 和 Tjmin, 最终 ΔTj 并不会被影响;饱和压降 VCE的测量与结温测量无关,不会受到阈值电压偏移的影响;从公式(1)可知,热阻 Rthjs 的计算依赖于结温的准确测量,器件老化后阈值电压产生的正偏移会使得测量的热阻升高,最终可能影响失效的判定,如图 2(a)。
综上所述, VGE(th)(T)法在功率循环测试中测量结温虽然会受到器件老化的影响,但一方面影响的程度不大 (3~10K), 另一方面只会对测量的热阻产生微弱的影响,而并不会对器件的寿命和失效机理产生很大影响。因此, VGE(th)(T)法是可应用于硅基 IGBT 器件结温测试的,唯一要注意的是不能与 VCE(T)法进行横向对比,因为代表的物理意义不一样。进一步地, SiC MOSFET 栅氧层界面缺陷在偏置作用下捕获沟道电子,会造成持续的阈值电压漂移[52],使得 VGE(th)(T)法暂不合适, 4.3 节将重点针对 SiC MOSFET 结温测试方法进行详细论述。

4.2 电流激励方法

绝大多数 DC 功率循环采用图 1(a)所示电流激励方法,也称为饱和压降法电流激励,通过给被测 IGBT 适当的栅极电压使其完全导通,也是所有标准约定的电流激励方法。测试电流流入 IGBT 产生的导通损耗来加热器件达到最大结温,这是最符合器件实际应用时导通状态的,也是器件寿命评估最佳的激励方法[8]。通过测量器件两端的电压,不仅可得到器件在大电流下饱和压降以表征键合线状态,还可得到小电流下饱和压降以换算器件结温和热阻。但由于缺乏开关损耗的叠加作用,就需要更大电流(甚至超过额定电流)来加热器件达到目标的最大结温和结温差,会使得器件键合线热应力过大, 可能远超过实际应用工况。一方面人为降低了键合线的寿命,另一方面还可能导致其他的失效机理,使得此测试不满足加速老化测试的基本原则-器件失效机理不能发生变化。

进一步地, 随着芯片和封装技术的不断迭代,IGBT 器件的饱和压降和热阻越来越低,而可靠性又越来越高,实质上需要更大的结温差来加速器件的老化进程,缩短测试周期。对于秒级功率循环,器件的壳温变化很小,一般认为器件最小结温 Tjmin 约等于最小壳温 Tcmin。由公式(3)可知,对于导通状态的电流激励方法则需要更大的测试电流,虽然可通过适当降低被测器件栅极电压以提高饱和压降来减小电流幅值,但可调节的范围有限。因此,降低测试电流的方法也只有两个:一方面是在不改变器件状态的前提下增加开关损耗,前面提及的 PWM 功率循环是一种情况,但本文不关注;另一方面就是不改变被测器件封装的前提下提高测试时器件的饱和压降,刚才提及的栅极电压是一种情况,但作用有限。

∆???????? = ???? ∗ ????????ℎ = ???????? ∗ ????????????(????????, ????????????) ∗ ????????ℎ (3)

文献[53]针对低压 MOS 器件饱和压降极低,无法利用额定电流进行功率循环老化的难题,改造常规 DC 功率循环测试电路, 如图 14 所示。测试电路包括 2 条主测试支路(Phase1 和 Phase2),每条 主 测 试支 路 又 由两 个 被 测 IGBT (DUT1 和DUT2)分别串联一个可调节电感 Lσ 并联后再串联一个被测 IGBT (DUT3)组成。通过控制一条主测试支路中两个并联 IGBT(DUT1 和 DUT2)栅极信号控制两个器件交替导通, 在电感 Lσ 上产生过电压后产生开关损耗。此开关损耗则可通过调节 DUT1和 DUT2 的开关频率和电感大小来实现,而 DUT3则是通过导通损耗来加热。

为了验证此电流激励方法的有效性,作者进行了大量不同条件和不同器件的功率循环测试,寿命结果如图 14 所示。IGBT 器件在不同测试条件和不同开关损耗占比情况下的寿命与 CIPS08 基本接近,差异不大。进一步地,文献还提及了器件的老化参数变化趋势和失效机理也一致。通过增加开关频率,提高开关损耗的占比,可减小测试电流,如文献[53]中达到 80K 结温差,测试电流可从 28A 可降低为 20A (被测 IGBT 为 1200V,25A)。综上所述,通过在常规 DC 功率循环额外增加开关损耗的电流激励方法可以在不改变器件失效机理和寿命的前提下减小测试电流。
公开发表的另一种解决方案是通过将 IGBT 器件的栅极 G 与集电极 C 短接,如图 15 所示[36],使器件两端的压降等于器件阈值电压, 强迫器件工作在阈值电压附近, 本文称为阈值电压法电流激励。此时 IGBT 器件并没有完全导通,沟道电阻很高,压降主要为器件阈值电压,所需要的电流很小。以 Infineon 公司 650V, 20A IGBT 为例[54],此器件 1s 己达到热平衡,结到壳热阻为 0.88K/W,若需要达到 ΔTj=90K 和 Tjmax=150℃的目标, 需要的功率约为 P=102W。对于饱和压降法电流激励方法,需要电流约为 IL=32.9A,此时压降 VCE=3.1V(@VGE=15V 和 Tjmax=150℃);若是阈值电压法电流激励方法,只需要电流约为 IL=20A (假定阈值电压为 5.1V)。可以看到,这种电流激励方法可大大减小测试电流,降低键合线的热应力,对于只对比不同焊料可靠性水平的测试可能比较合适。
阈值电压法电流激励方法虽然可大大减小测试电流, 但此方法不适用多芯片并联的模块。IGBT 芯片在阈值电压状态下是负温度系数,芯片间的些许差异就会导致某个芯片的电流过大,而降低功率循环寿命,甚至是热失控。对于实际应用和饱和压降法电流激励模式, IGBT 器件往往工作在正温度系数,借助于电导调制效应使得器件内部各芯片的电流均匀分布。虽然可以通过主动反馈的电压钳位电路来控制被测 IGBT 的电压[36],使得电压始终稳态在参考电压,避免出现热失控,但也使得功率循环测试过程中键合线的老化不能被表征。进一步地,这种电流激励条件下器件的失效机理和寿命是否与饱和压降法电流激励一致,目前还没有实验结果证明。
下图 16 展示的是 1200V, 25A 的 Easypack 封装 IGBT 器件在两种不同电流激励方法下的老化参数变化趋势和功率循环寿命的对比,测试条件均为 ton=2s, toff=4s, VGE=15V, ΔTj≈90K 和 Tjmax≈150℃。负载电流切断后的测量延时均为 200µs, 基于有限元仿真获得测量延时带来的结温测量误差约为 3K。饱和压降电流激励法有 6 个器件同时进行测试以避免随机性, 由于测试电路的复杂性,阈值电压电流激励法则只有 3 个器件同时测试,且测试电流远小于饱和压降法。所有器件均表现为芯片焊料失效(器件热阻 Rthjs 增加),且老化前后的静态参数(阈值电压 VGE(th)和栅极漏电流 Iges)并没有发生明显的差异,其中阈值电压偏移最大为 80mV。
图 16 为两种方法关键参数(ΔTj, VCE和 Rthjs)在老化过程的变化规律以及寿命对比,其中阈值电压法测量的热阻有很大的振荡是因为霍尔传感器件在测量小电流时的干扰。使得计算得到的热阻有振荡,但并不影响测试结果,从饱和压降 VCE的变化也可看到实际电流很稳定。可以看到,饱和压降法采用的电流约为阈值电压法的 3 倍,使得键合线应力过大,而导致器件的饱和压降 VCE在老化过程中上涨,进而加速了器件的老化,而图16(b)并没有发生变化。从本例可看到饱和压降法一般伴随着键合线和焊接的同时老化和相互竞争影响,而阈值电压法则只有焊料的老化。图 16(c)展示的器件寿命也存在很大的差异。

为了公平性,将两个不同测试的条件和寿命模型进行了对比,并归一到相同的条件。可以看到,当考虑器件测试时键合线的电流密度,阈值电压法的得到的寿命反而远低于 CIPS08 寿命模型,而饱和压降法的寿命与 CIPS08 吻合得比较好。假定被测器件只发生焊料失效时,其寿命差异相对较小,可考虑用阈值电压法等效;但当器件同时存在键合线失效时,或者不确定此器件是否 100%是焊料失效时,阈值电压法则会改变器件的失效机理和寿命,不可取。

4.3 SiC MOSFET 测试方法

SiC 材料虽然有众多优势,但前期也经历过10 多年才突破技术瓶颈,如德国 Infineon 在 2001年发布 SiC 的二极管后 10 年才有 SiC MOSFET 的商业产品(Rohm: 2011 和 Cree: 2012) [55]。国外半导体公司起步相对较早,产品、配套和相应测试方法也相对完善。国内对 SiC MOSFET 的研究,尤其是可靠性测试方法均晚于国外,爆发期集中在2018 年前后。

由于 SiC 材料的低势垒高度和 SiC/SiO2 界面的高陷阱密度, 使得 SiC MOSFET 的栅极出现阈值电压不稳定性,影响器件可靠性,如下图 17 所示[55]。阈值电压不稳定性可分为两种情况:一种是由于界面陷阱导致的可恢复的弛豫效应, 弛豫效应可看成是界面陷阱在施加正负栅极电压过程中完全充放电的动态过程,并不是器件的老化。但这个动态过程将会影响阈值电压测量的准确性以及基于其进行结温测量的准确性;另一种则是由边界陷阱导致的长期不可恢复的温度不稳定性(Bias temperature instability, BTI)。当栅极施加正偏压, SiC/SiO2 界面陷阱捕获电子而引起阈值电压正漂移(Positive bias temperature instability, PBTI);当栅极施加负偏压, SiC/SiO2 界面陷阱发射电子引起阈 值 电 压 负 漂 移(Negative bias temperature instability, NBTI)。而温度偏置不稳定性则是栅极长期老化的表现,直接导致阈值电压的漂移以及其他关联参数的变化。
上述阈值电压不稳定性会导致相应的结温测试方法需要重新考虑。进一步地,还需要考虑功率循环测试方法以及老化参数的监测方法。常用的通态电阻 RDS, on(T)会受到器件老化的影响,比如高栅极电压条件下阈值电压的漂移导致 RDS, on发生 退 化[56], 如 公 式(4)所 示 的 沟 道 电 阻 是 SiCMOSFET 的主要组成部分[55]。同时,器件功率循环老化后键合失效或者表面金属化也会引起 RDS, on的变化,此参数不适用于 SiC MOSFET 的结温测试。同样, 一方面由于栅极的弛豫效应使得在器件关断后极短时间内不能形成稳定的阈值电压,使得结温测量产生偏差;另一方面栅氧层缺陷也导致阈值电压在老化过程发生严重退化,不仅会影响结温测量的准确性,还会影响器件功率。
目前,被公认适用于 SiCMOSFET 器件结温测量的方法是利用器件体二极管(body diode)在小电流下的温度特性。测试电路如下图 18 所示[57],器件功率循环测试时通过给栅极正向电压(一般为15V)打开 MOS 正向通道,负载电流流入加热器件后给栅极足够的负电压(一般小于-6V,如图 18 (c))以完全关闭 MOS 反向通道,确保测量电流只流入体二极管,以建立稳定的二极管电压。同时, 栅极负压的选择对结温的准确测量和基于结温测量的其他测试非常重要, 下图 19 为某 SiC MOSFET器件在-2V 栅压下测量得到的瞬态热阻抗曲线。可以看到,瞬态热阻抗曲线呈现了先下降再上升的错误结果。因此, 在器件测试前必须根据具体器件和测试电路选择合适的栅极电压。虽然实际应用一般给定负压如-2V 或-5V 就足够关断,一些器件厂商己经将 SiC MOSFET 的栅极负压降低到-10V [58],以满足功率循环过程结温测量需求。
进一步地, SiC MOSFET 对测试电路和控制时序提出了挑战,开关延时的选择对器件结温测量准确性也有影响。由于 SiC MOSFET 的功率密度更高,材料导热率更大,使得结温在测量延时区间降温更快,如图 5 所示,需要重点关注测量延时带来的最大结温测量误差。进一步地,此方法不能用于反并联二极管的 SiC MOSFET 模块,这是由于反并联的二极管会将部分测量电流分走,无法形成稳定可靠的测试电压,亟需开发新的结温测试方法。鉴于 SiC MOSFET 在不同外部连接和栅极控制下有三种不同导通模式:正向 MOS 模式、反向MOS 模式和体二极管模式[57]。三种不同模式下器件老化特性以及与温度系数不一样将会导致不同的失效机理和功率循环寿命,比如:正向 MOS 模式下器件表现为正温度系数,加速器件的老化过程;而反向 MOS 模式为负温度系数, 一定程度上弥补和减缓了器件老化过程。文献[56]表明,两种不同模式下器件的寿命差异可达 2~5 倍, 正向MOS 模式是符合工况要求的,建议采用。而这也是与 Si MOSFET 特性不一样,电动汽车标准LV324 中允许利用体二极管加热来进行功率循环,但必须要注意测试电流的不一致对结果的影响[14]。如前所述,器件的饱和压降 VCE/VDS 在功率循环过程中用于表征器件键合线的老化状态,而此参数取决于器件的通态电阻 RDS, on (VDS=RDS, on*IL)。
对于 SiC MOSFET,此参数必然受到阈值电压漂移和老化影响,必须剔除影响使得测量的 VDS只表征键合线的老化状态才能准确判定器件的失效。阈值电压的漂移与所施加的电压极性,强度和时间有关, 文献[57]指出短时间内正负电压累积效果一致时, 可一定程度上“ 最小化”阈值电压漂移作用, 如下图 20 所示。SiC MOSFET 在同等条件下的功率循环寿命一般为 Si IGBT 的 1/3 [53],测试时间也非常短。在功率循环测试时,将开通时间、施加正向电压与关断时间、施加反向电压匹配,如正向电压 15V 施加 2s,反向电压-7.5V 施加 4s,可在一程程度上将阈值电压漂移导致的 VDS变化最小化。因此,对于 SiC MOSFET 的测试,要重点关注结温测试方法、功率循环测试模式和关键参数的影响。
5 数据处理
在可靠性数据分析和数理统计学中,威布尔分布是最有效的表征方法,但对样品数量有一定要求,样本数太少,随机性太强,结果不可信。当然,样本数量越多,可靠性测试的时间和成本就急剧增加,下图 21 为威布尔分布中测试结果的随机性和样品数关系图[59]。可以看到, 同一批测试 6~12 个样品数是合适的,但在实际测试中,不可能保证同一批测试的所有样品完全一样的测试条件,这就使得测试数据存在一定的分散性。进一步地,测量延时也会导致实际测量得到的最大结温存在一定的误差,使得器件的实际寿命要偏低。进行可靠性寿命评估和对比时,需要将延时时间带来的误差考虑并通过寿命模型进行修正。

下表 1 列出了某 1200V, 25A 的 TO-247 器件功率循环测试条件,选取了 6 个器件同时进行了测试 。测 试 条 件 均 为 ton=1s, toff=2s, VGE=15V,IL=42.5A, ΔTj≈90K, Tjmax≈150℃, tMD=100µs, 测量延时导致的结温测量误差通过有限元仿真修正[32],约为 3.6K。下图 22 为功率循环原始寿命、通过寿命模型修正后的寿命及与寿命模型的对比,所有器件均表现为键合线失效(饱和压降 VCE 增加 5%)。

可以看到,原始数据与标准的寿命模型差异比较大,数值上偏小, 这是由于测试电流(@42.5A)的影响, 电流越大,键合线自发热越严重,热应力越大,寿命越小。而为了体现寿命对比的公正性,一般选择器件的额定电流(@25A)进行修正,修正后的寿命与寿命模型相对接近。

6 结论

本文从功率循环基本原理出发,结合功率循环的测试需求和国内外研究现状, 对功率循环测试技术存在的挑战进行了深入分析,得到如下结论。

功率循环测试技术方面,核心要突破三个技术难点:电气测量噪声、测量延时和数据采集点。电气测量噪声是影响器件结温准确测量最为关键的影响,一方面需要高精度和高频测量系统,另一方面需要控制震荡幅值,以减小对结温测量干扰;测量延时是半导体器件在大电流切断后必不可少的载流子恢复时间,与器件本体和测试条件等均有关系,需要在测试前确认,并考虑延时时间带来的结温测量误差及其修正;数据采集点则是影响器件的失效模式判定和寿命,必须将结温对压降的影响进行解耦才能去判定键合线的老化状态。

功率循环测试方法方面,核心要突破三个层次的方法:结温测量、电流激励和 SiC MOSFET器件的测试挑战。综合全面对比分析了饱和压降法 VCE(T)和阈值电压法 VGE, th(T)两种结温方法的基本原理、测试电路、 结果准确度和适用性,还探讨了阈值电压漂移对测量结果的影响。这两种方法对于硅基 IGBT 均有很好的适用性,尤其是阈值电压法 VGE, th(T)在测量延时带来的结温修正上具有一定的优势;不同电流激励方法对器件的加热能力、失效机理和寿命均有不同程度的影响,常规DC 功率循环最为简单但缺失开关损耗使得某些器件的测试电流过大、带开关损耗的 DC 功率循环可有效解决此问题。但要重点关注的是基于阈值电压激励的方法可能导致失效机理和寿命发生变化,而且只适用单个芯片。由于大电流下阈值电压的负温度特性使得多芯片并联模块电流分布不均匀;SiC MOSFET 功率器件需要重点关注由于阈值电压漂移带来的结温测量和功率循环方法的问题,尤其是结温测量目前还不成熟,对于反并联二极管的 SiC MOSFET 模块, 目前没有成熟的方法。

数据处理方面,重点要关注测量延时带来的结温测量误差及其修正。同时,还要考虑实际测试中开关时间和测试电流对寿命的影响等, 尤其是键合线失效的器件。这是器件内部键合线不仅被芯片加热,更多来源于键合线自身流过电流产生的焦耳热,这使得其很大程度上影响键合线的寿命。进一步地, 从随机性和偶然性来看,同一批测试的样本数量最好是 6~12 只,然后基于 6 只器件的功率循环寿命进行威布尔分布数理统计。

来源:中国电机工程学报

作者:邓二平,严雨行,陈杰,谢露红,王延浩,赵雨山,黄永章新能源电力系统国家重点实验室(华北电力大学)

(以上文章系转载,并不代表半导体在线的观点,如有涉及版权等问题,请联系我们以便处理)


功率器件功率循环测试技术的挑战与分析
半导体在线
长按图片保存/分享
0

关于泰斯特尔

新闻资讯

联系我们

产品中心

办公电话

0755-23303946

 

0755-28265640

 

手       机:159 8956 7281 施经理
手       机:159 9950 5313 冯经理

公司邮箱:info@tiast.cn

施  经  理:sales1@tiast.cn              
冯  经  理:sales4@tiast.cn

版权所有:深圳市泰斯特尔系统科技有限公司   备案号:粤ICP备2020113191号  网站地图

添加微信好友,详细了解产品
使用企业微信
“扫一扫”加入群聊
复制成功
添加微信好友,详细了解产品
我知道了