你刚买了一块新的CPU或显卡,在电脑上启动了它。它运行起来感觉很酷,于是你尝试了一下超频。频率越来越高,看起来你似乎得到了一些特别的东西。这肯定不应该吧?
于是你冲到互联网上分享你中了硅片大奖的兴奋之情,没过几条帖子,就有人宣称你得到了“一块被淘汰的芯片”。
现在,如果你正在想象一位工程师在垃圾桶里翻找,然后自豪地掏出一张金票,那么你真的需要读读这篇解释!欢迎来到处理器制造和芯片装箱的神奇世界。
TL;DR:什么是芯片分级?
- 芯片制造并非完美无缺。你的电脑(例如 CPU 或GPU)、手机或汽车中使用的每款芯片都经过了严格的筛选。这是因为制造完成后,某些芯片的性能会优于其他芯片。
- 所有芯片制造商,如 Nvidia、AMD、英特尔、高通和其他基于 Arm 的制造商,都采用了一种选择流程,其中性能更高的芯片被指定为更昂贵的型号出售(提供更高的时钟速度、更多的内核等),而不太完美但仍可充分利用的硅片可以作为性能较低的处理器出售,内核被禁用或速度较低。
- 其他例子:如果芯片无法以 2 GHz 的频率运行,那么你可以将其作为 1.5 GHz 的频率运行的芯片出售。或者,如果 CPU 的集成显卡部分存在缺陷,那么你可以将其作为不带集成显卡的 CPU 出售。
- 芯片分仓是所有微处理器和 DRAM 芯片制造过程中进行这种分离的一个阶段。
- 虽然常规的芯片分类是为了给制造商带来优势,但如果对某一特定价值/主流型号的需求过多,您可能会很幸运,最终得到作为更便宜的部件出售的功能非常强大的硅片/芯片。
- 分档还能提高晶圆的良率,因为可以利用和销售更多的硅片,从而降低制造成本。本文将深入探讨芯片制造流程以及某些决策背后的原因。
晶圆到芯片
所有芯片都是由超纯硅圆盘制成,上面覆盖着金属、绝缘体和半导体材料,无论是标准CPU、专用图形处理器还是作为系统内存的DRAM 。
整个过程极其复杂,大批量生产最新芯片所需的制造工厂耗资数十亿美元。随着极紫外 (EUV) 光刻技术的采用,这一过程变得更加复杂,它使得芯片能够在 3 纳米节点上制造,从而提高了性能和能效。这些圆盘被称为晶圆,台积电、英特尔和格芯等公司每年生产数百万个晶圆。
需要最高质量的工具来确保最终产品符合设计芯片的工程师的超精确计划。
为了确保一切尽可能完美,工厂的生产区域会略微加压,以防止空气中的细菌和灰尘颗粒进入房间。工人们会穿戴防护装备,以确保尽可能少的皮肤细胞和毛发进入机器。
成品晶圆非常美丽,而且非常有价值。
每块硅片的制造成本高达数千美元,而从硅锭到成品的整个制造过程需要数月时间。从硅片上取下并出售的每一块芯片(也称为“裸片”)对于收回制造成本至关重要。
为了取出这些碎片,需要用金刚石锯将晶圆切割,但其中相当一部分碎片完全是废料,因为边缘的碎片并不完整。大约有5%到25%的晶圆(具体数量很大程度上取决于芯片的尺寸)会被丢弃。
其余部分随后被安装在电路板封装上,并可能覆盖有散热器,最终成为我们都熟悉的 CPU。
核心不平等
让我们来看看英特尔相对较新的处理器之一——2020年发布的旗舰级酷睿 i9-10900K,它拥有 10 个核心和集成 GPU。下图展示了我们通常所见的这类 PC 组件,但如果我们能撬开散热器,用各种工具深入芯片内部,它的外观将会截然不同。
实际的 CPU是由逻辑块、SRAM 存储、接口和通信总线组成的整体——仅在一个芯片中,就有数十亿个单独的电子元件,它们都同步协调地工作。
下方标注的图像突出显示了一些关键区域——最左边是 I/O 系统,包含 DDR4-SDRAM 内存、PCI Express 和显示控制器。此外,还包含管理所有核心通信环的系统。
I/O 部分正上方是系统内存接口,在芯片的另一侧,我们可以看到集成显卡,也就是 GPU。无论你选择哪款英特尔酷睿处理器,这三个部分都会存在。
所有这些部件之间都塞满了 CPU 核心。每个核心都彼此复制,充满了用于处理数字、移动数据和预测未来指令的单元。核心两侧是两条三级缓存(较低级别位于核心内部深处),每条缓存提供 1 MB 的高速存储空间。
您可能认为英特尔会为其销售的每款 CPU 制作一块新晶圆,但单个“i9-10900”圆盘将生产出可能最终用于以下任何一种型号的芯片……
“基本频率”(Base Clock)以 GHz(千兆赫)为单位,指的是芯片在各种负载下都能保证的最低运行频率。“全核睿频”(All Core Turbo)指的是所有核心同时运行的最高频率,但不一定能维持很长时间。“睿频加速”(Turbo Boost)与此类似,只不过这里只针对双核运行。
PL1 TDP 代表功率等级 1 - 热设计功率。它指的是 CPU 在任何负载下以基本时钟频率运行时产生的热量。它产生的热量可能远高于此,但它会限制芯片的运行速度。当芯片插入主板时,主板设计人员可能会限制芯片的功耗,以防止出现这种情况。
代码以 F 结尾的型号表示 GPU 已禁用;K 表示其时钟系统已解锁(因此可以轻松超频);T 表示低功耗。这些只是桌面 CPU——有些最终会升级为 Xeon 型号,以工作站或小型服务器的形式面向专业市场。
故事重演
如上表所示,仅英特尔一款设计就有 19 款型号……但这种情况在更现代的 CPU 系列中也屡见不鲜,例如 AMD 的 Ryzen 9 7950X与 Ryzen 9 7900。7950X是一款顶级 16 核处理器,具有更高的基本频率和加速频率,旨在实现最高性能和效率。Ryzen 9 7900 是同一系列的 12 核 CPU,禁用了核心,旨在降低频率和功耗,但两者都来自同一款芯片。
同样,Ryzen 5 7600与 Ryzen 5 7600X也存在类似的情况。与其他“X”版本一样,7600X 是高分频部件,具有更高的 TDP,使其能够以比非 X 版本更高的持续时钟速度运行。
如果我们看一下 GPU,情况完全一样。RTX 4090和RTX 4080 GPU 都基于高性能 AD102 芯片,但 RTX 4090 是更高分档版本,启用了更多核心并具有更高的升压频率,从而能够达到峰值性能。另一方面,RTX 4080 由于分档而具有更少的 CUDA 核心和更低的功率限制,这使得 Nvidia 能够为要求不高的应用提供价格略低且性能更高的显卡。
Nvidia 还根据内存接口能力对芯片进行分类,在顶级型号中提供更高的内存带宽,而在更实惠的版本中降低内存带宽,例如 4060 Ti 8GB 与 16GB。
高通是移动处理器中芯片分级的另一个例子,该公司为三星等公司打造了骁龙 8 Gen 2 的定制版本,通过调整芯片频率使其能够适应 Galaxy 设备的更高主频。这些“专为 Galaxy”打造的芯片性能略高,并且经过分级以确保在更高频率下的稳定性,这使得三星旗舰手机在峰值性能方面略胜其他骁龙 8 Gen 2设备一筹。
高通还利用分级技术来生产用于中端设备(例如骁龙 7 系列)的低性能版本。这些型号与旗舰芯片共享核心架构元素,但由于分级限制,其运行时钟速度和能效水平会有所降低。
苹果还利用其M 芯片系列的分级机制,在 MacBook Air、MacBook Pro 和 iPad Pro 等设备上创建不同的性能层级。例如,M2 Pro 和 M2 Max 共享相同的架构,但苹果根据核心数量和 GPU 性能对这些芯片进行了分级,提供不同的版本。例如,M2 Pro 提供 10 核或 12 核 CPU 配置,其中 10 核版本是分级较低的版本,旨在满足略低的性能需求。M3和M4系列SoC 也是如此。
但是,为什么一个芯片最终会变成这么多不同的类型呢?
这是一个不完美的世界
芯片制造厂虽然令人惊叹,但无论是工厂本身,还是所使用的技术和材料,都并非100%完美。工厂内部,或是所使用的硅和金属原料深处,总会残留一些纳米级的杂质。无论制造商如何努力,都无法让这些杂质完全洁净纯净。
当您尝试构建非常小的组件时,只有高倍电子显微镜才能看到它们,没有任何东西能够完全按照应有的方式运行。
在纳米世界里,量子行为变得更加明显,随机性、噪声和其他故障会尽力扰乱芯片叠叠乐这种微妙的游戏。所有这些问题都会对处理器制造商不利,最终结果被归类为缺陷。
并非所有缺陷都严重——它们可能只是导致芯片的某个特定部分温度过高,但如果严重到一定程度,整个部分都可能完全报废。制造商首先要做的就是扫描晶圆,查找缺陷。
专门用于查找这些问题的机器在晶圆制造完成后、切割成单个芯片之前使用。出现问题的芯片或整个晶圆都会被标记出来,以便留作进一步检查。
但即使这些步骤也无法发现每一个小瑕疵和故障,因此在将硅片从晶圆上切下来并安装到封装上之后,每一片都要进行更多的测试。
并非所有垃圾箱都存放垃圾
当英特尔和其他公司检查其处理器的质量时,他们会将芯片设置为在一定的电压和一定的时钟速度下运行;而芯片则会经过一系列的基准测试,旨在对所有各个部分进行压力测试,同时会仔细测量所消耗的电量和产生的热量。
他们会发现,有些芯片的运行完全符合要求,而有些芯片则更好或更差。
有些芯片可能需要更高的电压才能完全稳定,其他芯片的内部可能会产生过多的热量,有些芯片可能根本无法达到所需的标准。
对已确定有缺陷的处理器也进行了类似的探索,但在进行此操作之前,还要进行额外的检查,以查看芯片的哪些部分仍能工作,哪些部分已报废。
最终结果是,晶圆的有效产出(称为良率)会产生一系列芯片,这些芯片可以根据其功能部件、稳定的时钟频率、所需电压和发热量进行分类。这种分类程序叫什么?芯片分级。
实际上,没有骰子会被扔进大型塑料箱里——这个说法源于统计学,指将数字的分布组织成不同的组,称为“箱子”。例如,关于年龄分布的人口调查可能会使用0至5岁、6至10岁、11至16岁等等的箱子。
对于晶圆也采取同样的措施,以我们的 i9-10900K 为例,其中一些箱子将用于表示工作核心的数量、CPU 稳定的时钟频率范围以及特定时钟下的热量输出。
假设一块 Core i9-10900 芯片经过全面测试,发现存在一些严重缺陷,如上所述。两个核心和 GPU 损坏严重,无法正常工作。
英特尔随后会禁用“kaput”部分,并将其标记为 Core i7-10700 系列芯片,具体来说是 F 型号。但之后需要测试其时钟速度、功耗和稳定性。如果芯片达到了所需的目标,它将保留 i7 型号;但如果无法完全达到这些目标,则可以禁用另外两个核心,并将芯片用于 Core i5 型号。
假设一块 Core i9-10900 芯片经过全面测试,发现存在一些严重缺陷,如上所述。两个核心和 GPU 损坏严重,无法正常工作。
英特尔随后会禁用“kaput”部分,并将其标记为 Core i7-10700 系列芯片,具体来说是 F 型号。但之后需要测试其时钟速度、功耗和稳定性。如果芯片达到了所需的目标,它将保留 i7 型号;但如果无法完全达到这些目标,则可以禁用另外两个核心,并将芯片用于 Core i5 型号。
总而言之,芯片分级极大地提高了晶圆的产量,因为这意味着可以利用和销售更多的芯片。
就第十代酷睿处理器而言,英特尔确实为酷睿 i5、i3 和奔腾/赛扬系列提供了单独的晶圆设计。这些芯片最初是 6 核,然后逐渐细分为 2 核版本。
产品需求常常会超过生产能力,因此需要使用10核晶圆来帮助满足订单。有时,为了确保工厂有足够的产量,一些功能完好的芯片会被关闭。这意味着,购买特定型号的芯片时,最终能拿到什么型号的芯片,就像是一场硅片抽奖游戏。
总而言之,芯片分级技术极大地提高了晶圆的良率,因为这意味着更多的芯片可以被利用和销售。如果没有它,英特尔的垃圾桶里肯定堆满了废硅片。
分箱 CPU 不是很特殊吗?
就像计算机领域的许多术语一样,“芯片分档”如今已不再是其原意。过去,网上商店会把精心挑选的特殊 CPU(那些超频到疯狂程度或运行温度比冥王星表面还低的 CPU)当作“分档 CPU”来销售。但事实上,所有芯片都会被分档,仅仅是因为它们不得不如此。
当然,没有什么可以阻止零售商将他们购买的芯片丢弃:丢弃的 CPU,有人吗?
AMD 和 Intel 处理器必须批量购买(托盘里装着几十甚至几百颗芯片),然后你可以用测试电脑测试每一颗处理器——超频或降压、记录温度等等。然后,这批处理器中最好的部分可能会作为特供出售,零售商也理所当然地会把它们归类为“废品”。当然,所有这些额外的测试都需要时间和精力,因此产品的零售价也会随之上涨。
这些所谓的“分档芯片”是否在某些方面格外特别?是也不是。你的电脑、手机、汽车等等设备中使用的每一块芯片都经过了某种筛选过程。这只是所有微处理器和 DRAM 芯片制造过程中的另一个阶段。这意味着,你心爱的 CPU 或 GPU,即使运行速度惊人地酷炫,或者超频速度惊人,也不过是来自全球工厂生产的数十万块晶圆中的一块芯片而已。
https://www.techspot.com/article/2039-chip-binning/