什么叫Chip Binning(芯片分类)?
想必大家都有关注Apple这次发布的新款A15 仿生芯片。A15在四款iPhone 13系列中CPU都是相同的2个性能核与4个能效核,但GPU的部分略有差别。13和13 mini是4核GPU,而13 Pro和13 Pro Max的GPU则是5核。
这个现象大家可能也不陌生,还记得之前M1 Macbook Air便是如此,分为7核GPU、8核GPU。
这种现象在芯片行业其实较普遍,为了节约成本一般是采用了Chip Binning(芯片分类),那么到底什么是Chip Binning呢?
那些报废掉的晶圆
所有的芯片都是由超纯的硅片制成的,上面铺有金属、绝缘体和半导体材料,无论是标准的CPU、专门的图形处理器,还是系统内存DRAM。整个过程极其复杂,芯片制造厂需要巨大的产能,耗资数十亿美元。
一座现代化的芯片制造工厂内部。(图片来源:TSMC)
那种我们在网上常看到的光盘形状的东西就是晶圆,Intel、GlobalFoundries和TSMC等每年都要生产数百万张晶圆。生产过程需要最高质量的工具来确保最终产品符合芯片设计工程师的设计。
为了使一切尽可能地接近完美,工厂的生产区都会略微加压,防止空气中的细菌和灰尘颗粒进入房间。工人们穿着防护装备,确保他们的皮肤细胞和头发尽可能少地进入机器。
Intel的工厂
成品晶圆非常漂亮,也非常珍贵。每一块都要花费数千美元来制造,整个制造过程从硅锭到成品,需要几个月的时间。每一个可以从晶圆中切割出来出售的芯片(也被称为die)对于收回制造成本都至关重要。
Intel第九代酷睿处理器的11.8英寸(300mm)晶圆
为了切割芯片,需要采用金刚石刀锯,但其中有相当比例的晶圆会完全报废,因为你从图片中也看得到边缘的芯片并不完整。通常情况下会有5-25%的晶圆报废(报废数量大小取决于芯片的大小)。
剩余的部分就会被顺利安装在电路板封装,还可能会覆盖一个散热器,最终成为我们都熟悉的CPU。
以酷睿系列处理器为例让我们来看看Intel酷睿系列最新处理器,其中最强大的是酷睿i9-10900K,它有10个内核和一个集成的GPU。
下图是我们通常会看到的这种PC组件的样子,但如果我们能撬开散热器,使用工具深入到芯片的内部,它看起来会非常不同。
实际的CPU是一个由逻辑块、SRAM存储、接口和通信总线构成的丰富的景观。仅在一个芯片中,就有数十亿个独立的电子元件,它们都在同步和谐地工作。
下图突出了一些关键区域。最左边的是I/O系统,包含DDR4-SDRAM内存、PCI Express和显示控制器。这里还包括管理所有内核的通信环的系统。就在I/O部分的上方是系统内存的接口,在芯片的另一侧,我们可以看到集成的图形芯片,即GPU。无论你接触到的是什么型号的Intel酷睿处理器,这3个部分都会出现。
塞在所有这些之间的是CPU内核。每一个都是另一个的副本,充满了计算数字、移动数据和预测未来指令的单元。在内核两侧的是两条L3缓存(低级别的缓存在内核深处),每条缓存提供1MB的高速存储。
你可能认为Intel会为他们出售的每一个CPU制造一个新的晶圆,但一个i9-10900晶圆可能会生产出以下任何一种型号。
Base Clock以GHz为单位,是芯片运行的最低保证频率,无论它处于什么负载下。All Core Turbo是所有内核可以一起运行的最大频率,但不一定能保持很长时间。这与Turbo Boost类似,只是它只是两个内核。
PL1 TDP是Power Level 1,热设计功率。它是指CPU在任何负载下以其Base Clock运行时将产生多少热量。它可以产生很多热量,但它将限制芯片的运行速度,当插入主板时,设计者可能会限制芯片的功率,以防止这种情况。
代码以F结尾的型号都有一个禁用的GPU;K表示有一个解锁的时钟系统(所以你可以很容易地超频),T则表示低功耗。这些只是台式机CPU,有些最终会成为Xeons,即面向工作站或小型服务器等专业市场的处理器。
因此,仅一种设计就有19个型号,为什么一个芯片最终会变成这么多不同的类型呢?
这是一个不完美的世界
尽管芯片制造厂看起来非常无懈可击,但无论是工厂还是所使用的技术和材料都不是100%完美的。总会有一些纳米级的杂物,要么在工厂内,要么在原材料硅和金属的什么地方。无论他们如何努力,制造商都不可能保证完全清洁和纯净。
当你试图制造一个如此小的组件时,只有高能电子显微镜才能让你看清楚细节,没什么东西能完全按照设计的那样表现。在纳米世界中,量子行为变得更加明显,随机性、噪声和其他故障会尽力扰乱芯片的层叠游戏。所有这些问题都让处理器制造商非常头疼,最终结果只能被归类为缺陷。
并非所有的缺陷都很严重。它们可能只是导致芯片的某个特定部分运行时温度高于正常水平,当然如果情况真的很糟糕,那么整个部分可能就全要报废掉了。所以,制造商首先做的就是扫描晶圆,寻找缺陷。
寻找缺陷与光散射方法(来源:Hitachi High-Tech)
专门用于检测缺陷的设备是在晶圆被制造出来之后、但在被切割成单个芯片之前使用的。显示出有问题的芯片或整个晶圆会被标记出来,然后将其单独搁置进一步检查。
但是,即使是这些步骤也不能抓住每一个微小的瑕疵和故障,所以在芯片从晶圆上切割并封装之后,每颗芯片还要进行更多测试。
用Chip Binning提高成品率
当芯片公司坐下来检查其处理器的质量时,他们将芯片设置为以设定的电压和一定的时钟速度运行;当芯片通过一系列的基准测试时,旨在对所有不同的部分施加压力,功耗和产生的热量会被仔细测量。
他们会发现,有些芯片完全按照要求运行,而另一些芯片则更好或更差。
一些芯片可能需要更高的电压才能完全稳定,其他芯片的内部可能会过热,很可能有些根本达不到要求的标准。
组装处理器之前的最后测试和检查(图片来源:Intel)
对确定有缺陷的处理器也会进行类似的探索,但在此之前,要进行额外的检查,看芯片的哪些部分仍在工作,哪些是需要报废的。
这样做的最终结果是,一个晶圆的有用产出(产量,yield)产生了一系列的分类,它们可以根据其功能部件、稳定的时钟频率、所需的电压和热输出进行分类。这种分类就叫做“Chip Binning”。
在i9-10900K的例子中,一些分类就是工作内核的数量、CPU稳定的时钟频率范围,以及在某个时钟下的热输出。
让我们想象一下,一个酷睿i9-10900芯片经过了全部测试,发现有几个严重的缺陷,如上所述。其中两个内核和GPU损坏到无法正常工作的程度。
然后,英特尔将禁用这些坏掉的部分,并将其标记为酷睿i7-10700系列芯片,特别是F型号。但随后需要对其进行时钟速度、功率和稳定性测试。如果该芯片达到了所需的目标,它将继续作为i7,但如果它不能完全达到这些目标,另外两个内核可以被禁用,然后用作i5。
就第十代酷睿处理器而言,英特尔确实为酷睿i5、i3和奔腾/赛扬系列采用了单独的晶圆设计。这些开始是6核的芯片,后来也开始有2核的产品。
产品需求往往会超过产能,因此Chip Binning就极大地提高了晶圆的成品率。有时,为了保证足够的产出,功能完好的芯片也会被关闭一部分。这确实意味着,当你购买一个特定的芯片时,你实际上得到的是什么,简直就像是在买彩票。
综上所述,Chip Binning极大地提高了晶圆的产量,因为它意味着更多的芯片可以被利用和销售。
Binned CPU很特别吗?
就像计算机领域的许多术语一样,Chip Binning已经成为其原始含义以外的意思。网店上有时会将这类手工挑选的特殊CPU(那些超频到疯狂程度或运行时比冥王星表面还冷的CPU)作为“Binned CPU”出售。现实情况是,所有的芯片都是分类过的,只是因为它们必须这样做。
当然,没什么能阻止零售商对他们购买的芯片进行分装:Binned-Binned CPU,有人要吗?
AMD和Intel的处理器必须批量购买(盘子里有几十个,甚至几百个芯片),你可以坐下来用一台测试电脑检查每一个芯片,超频或降频,记录它们的温度,等等。然后,这批产品中最好的可以作为特殊产品出售,零售商可以正确地将它们分类为“Binned CPU”。自然,所有这些额外的测试都需要花费时间和精力,所以就会反映在产品的零售价上。
这些所谓的Binned Chip在某些方面特别吗?是的,也不是。你的电脑、手机、汽车等使用的每一个芯片都经过了某种选择过程。这只是所有微处理器和DRAM芯片制造过程中的另一个阶段而已。
[参考文章]
What Is Chip Binning(Hitting the Silicon Lottery Jackpot) — Nick Evanson