将芯片嵌入堆叠芯片组件会产生散热问题,从而降低这些设备的可靠性和使用寿命,随着芯片制造商开始将芯片塞入带有更薄基板的先进封装中,这个问题变得越来越严重。
过去,几乎所有这些复杂的设计都用于严格控制的环境,例如大型数据中心,通过将部分计算转移到不同的服务器刀片或机架,可以快速解决过热问题。但这些堆叠的芯片组件现在正进入安全至关重要的应用,例如 传感器和心脏起搏器,这些应用中可用的选择较少。从根本上讲,可靠性受热循环的影响,因此每次打开芯片时,它都会加热、冷却、膨胀和收缩,但当芯片被紧密封闭时,冷却时间可能会显著延长。
英飞凌科技公司物联网、计算和工业 MCU 高级总监 Ketan Dewan 表示:“热管理绝对必要。如果管理不当,可能会导致性能损失、运行不可靠、设备故障和系统成本增加。”
更糟糕的是,许多此类设备都涉及不同的材料。“你要处理的是差异膨胀,” Ansys产品营销总监 Marc Swinnen 指出。“如果你拿一块金属,加热一端而不加热另一端,你的芯片就会弯曲和变形。”
翘曲会破坏各种计算元件和基板之间的连接,迫使信号重新路由并降低性能。与热相关的应力还可能造成热失控,连接变得非常热,导致凸块熔化或改变电路行为。后一种影响可能导致参数漂移,在这种情况下,芯片最初可能按预期工作,但最终不再符合其最初定义的参数。因此,设备在发布时可能看起来没有问题,但几个月后就会出现异常或彻底失效。
分立器件更加隔离,但它们也不能免受热问题的影响。“它们可能会产生热量,但由于芯片位于基板上,所以热量有地方可以散发,所以散热会容易一些,”西门子 EDA的 Calibre nmDRC 应用产品管理总监 John Ferguson 表示。“当你堆叠东西时,事情会变得更加困难。并排放置还不算太糟,但你可以跨边界进行交互。”
物理问题可能会变得更加复杂,这取决于布局和与其他电路的接近程度。
例如, 传感器可能受到热量和振动的影响,具体取决于它们的位置,这意味着热应力和机械应力都会成为问题。
“当你谈论嵌入式系统时,不仅仅是元件本身产生的热量,还有邻近元件产生的热量,”Swinnen 说。“它嵌入在某个东西中,然后它旁边的东西也会产生热量,所以你的芯片会突然产生一股热量,这与你正在做的事情无关。是隔壁的芯片变热了,但你的温度上升了,看起来好像是你的芯片在发热。”
封装层面的异质性增加了设计方面的复杂性。“从历史上看,热分析的方式是,封装中的芯片不仅被视为均匀的材料,而且被视为均匀的温度,”Ferguson 说。“但这种观点未能涵盖相互作用的全部复杂性。芯片是热量产生的源头,但它们也可能是热量的受害者。如果你在封装层面考虑这个问题,那么抓住这一点很重要。”
然而,即使设计师意识到了这些问题,在嵌入式设备中缓解这些问题也并不容易。Cadence 产品管理总监 Melika Roshandell 表示:“例如,对于手机而言,热分析非常重要,因为你不能在手机中放置散热器。此外,手机没有风扇,当你把它放在耳边时,你肯定不希望它烫伤你的脸。如果没有热缓解措施,它就会变得那么热。手机设计师必须考虑如何让芯片达到最大频率,同时又要符合人体工程学,不会烫伤皮肤。他们必须进行大量的传导和辐射分析来确定阈值。由于空间有限,他们面临着更多挑战,必须在解决散热问题上更具创新性。”
即使可以使用风扇等传统冷却解决方案,也可能不是理想选择。“风扇会造成电气干扰,但这只是一个次要问题,” Flex Logix首席执行官 Geoff Tate 表示。“风扇最大的问题除了体积大、噪音大之外,就是容易损坏。如果风扇坏了,冷却系统就会崩溃。所以现在问题大了。当你添加更多晶体管,晶体管运行速度更快时(这是每个人都希望的),就会消耗更多电量。但封装只能耗散一定量的电量。即使你将这个封装放在冷空气中,到某个时候它也无法散发足够的热量。所以你需要安装一个散热器,散热器会覆盖整个大散热片。它们可以散发更多的热量。然后你可以将它用螺栓固定在金属盒的侧面,金属盒也变成了散热器,你可以将它放在室外环境中。”
但问题不止于此。事实上,根据环境的不同,情况可能会变得更糟。“客户可能会说,‘它必须能在室外使用,我们在凤凰城,那里的温度是 125°F,’”泰特说。“或者它必须在加拿大埃德蒙顿 -40°F 的环境下工作。你必须能够在很宽的温度范围内工作,所以你必须设计你的芯片,弄清楚它的所有部件,对封装和冷却进行热分析,并了解客户将如何使用它。然后,你必须反向思考,了解你可以在芯片中放什么,以及你可以让它运行多快,因为如果你让芯片太强大,它会消耗太多的电量,而你无法消散它。然后它会超过结温,你必须保持在结温范围内,因为如果结温太高,可靠性就会降低。有些客户会说,‘我不希望结温升到这个水平,但我希望它能更高一些。’这很快就会变得非常复杂。”
即使在凤凰城这样的条件下,设备也可以放置在受控环境中,例如监控空调商店的摄像头。但设计师还必须考虑客户是否会始终遵守这些规范,以及要留出多少余地。毕竟,即使是最好的 HVAC 系统也有可能出现故障,或者原本应该放在阴影角落的传感器可能会被移到靠近大窗户的地方,从而受到阳光直射的加热。
环境考虑
此类环境不确定性,加上许多嵌入式设备使用的关键情况,可能导致保守的设计和封装选择。这包括在较旧的工艺节点上开发芯片/小芯片,以获得经过验证的可靠性,以及挑战性较低的组装选项。这些选择也可能受到责任问题以及工程问题的影响。“我看到合同中有更多的法律术语,”弗格森观察到。
对于嵌入式设备,工程问题通常与人类安全问题重叠。“如果你有一个医疗器械,你把它放入人体,它会发热,这会对人体造成什么影响?”弗格森问道。“或者更糟的是,如果人体承受压力,从而产生热量,这会影响包装吗?你需要更加保守和谨慎,考虑到如何处理这些东西。”
想想热管理不佳的起搏器会发生什么。“起搏器的使用寿命应该超过 10 年,”英飞凌的 Dewan 说。“但如果嵌入式设备没有进行热管理,嵌入式设备的漏电和功耗可能在不到 10 年的时间内就需要更换电池。”
即使在体外,也需要极其谨慎。 行业已经制定了ISO 26262,这是一项由 12 部分组成的安全标准,规定了 电子产品的最佳实践。遵守 ISO 26262 的要求为克服热问题提供了更令人信服的理由,此外还有一个简单的经济事实:设备越热,在采用冷却解决方案上需要花费的钱就越多。
解决方案
有几种方法可以缓解先进封装中的热问题。从 EDA 的角度来看,首选方法是在设计周期的早期解决这些问题,使用实际工作负载进行广泛的模拟和原型设计。这越来越多地涉及使用数字孪生。
“首先要考虑芯片的放置位置,”西门子的 Ferguson 说道。“你能否更好地选择放置位置,以免过多的热量集中在一个区域?下一阶段将着眼于芯片本身。有什么办法可以散热?如果你无法移动任何东西,如何散热?”
对于嵌入式设备,还有额外的考虑因素。“解决方案必须再修改一下,”Ferguson 说。“你可以在封装中采用各种形式的冷却,比如散热器。你可以在顶部放置 TIM(热界面材料)来帮助冷却。如果你将一个芯片放在另一个芯片之上,那么底部芯片可能会加热顶部芯片。现在顶部芯片没有太多空间来散热,所以你可以放入铜柱作为一种烟囱。”
从多物理角度来看,与所有其他电子模拟相比,热模拟的最大区别在于需要有限元网格。“这是一个体积网格,而不是表面网格,因为热量在表面的三个方向上流动,”Ansys 的 Swinnen 说。“利用设备的体积网格,您可以模拟功率如何扩散,以及环境温度如何侵入您的系统并扩散到整个系统。”
结论
散热问题是设计中一个长期存在且日益严重的问题。“对于某些设备来说,散热问题一直存在,但这不是芯片设计师需要处理的问题,因为封装设计师会在最后阶段处理它,”Swinnen 指出。“你对可以使用的功率有一个概念,如果结果显示功率稍高,没有人会因为功率过高而放弃芯片。功率曾被视为软性指标,但现在它已成为头号问题。散热与功率直接相关,但两者是两码事。功率使用就是金钱,但功率会导致散热,因为功率最终会以热量的形式散发出去。嵌入式设备,无论你如何定义它们,都是在某个东西的内部,这意味着它们更难冷却。你要增加功率密度,即你每立方体积使用的功率。然后你需要以某种方式将所有热量散发出去,因此冷却变得更具挑战性。3D-IC 的尖端芯片设计正在考虑液体冷却和全浸没等想法,但(在嵌入式设备中)只有有限的几个问题可以通过这种方式解决。”
最终,解决困扰嵌入式和分立设备的散热问题可能需要新材料(如玻璃基板)和对现有组件的新思维。“从历史上看,我们根深蒂固地认为我们需要尽可能快的互连,”Ferguson 说,“但我们是否可以选择对热敏感度较低的互连——可能是一种像 TSV 这样的宽垂直连接?我们需要弄清楚的部分是权衡。你可能会占用大量可用于其他用途的区域。最好的选择是什么?例如,你可能希望让你的连接非常薄,但这意味着更高的电阻率,这可能会产生更多的热量。你必须弄清楚伴随好处而来的所有副作用。”
【来源:半导体行业观察】