NVIDIA 在 2021 年的 GTC 大会公布品牌首款 CPU 处理器 NVIDIA Grace ,宣示 NVIDIA 借助 Arm 指令集正式跨足超算 CPU 领域,而 2022 年的 Computex , NVIDIA 藉宣布新一代超算 GPU Hopper 之际,一并公布称为 Grace CPU Superchip 与 Grace Hopper Superchip 的双晶粒晶片计画,後续再度於 2022 Computex 公布其 Grace CPU Superchip 与 Grace Hopper Superchip 将由伺服器夥伴在 2023 年推出的消息。虽然从顺序来看似理所当然,但对 NVIDIA 而言,今年在 Computex 宣布将由合作夥伴提供伺服器的消息对 NVIDIA 跨足伺服器领域显得相当重要。
虽然 NVIDIA 当前在 GPU 市场已是首屈一指的品牌,同时也借助 CUDA 技术使 GPU 在加速运算、 AI 等奠定不可动摇的地位,然而从 CPU 发展的角度, NVIDIA 也仅有过去为了行动运算开发 Tegra 平台、後续随着市场局势转型为 Jetson 平台,不过也仅止於低功耗产品,与高效能运算层级相去甚远; Grace CPU 看似隔空出世,不过对 NVIDIA 却也是不得不的抉择。
▲ x86 CPU 生态系长期由 AMD 与 Intel 占据, NVIDIA 当前异构运算仍须仰赖搭配两者的处理器
从以往 NVIDIA 加速技术在超算领域所遇到的情况,即是 CPU 受限於 AMD 与 Intel 等传统 x86 厂商,偏偏 AMD 与 Intel 也不可能乖乖看着 NVIDIA 独自大放异彩,也借助自身资源自行发展完整的配套方案;同时,NVIDIA 为了使异构更具效益,自行开发称为 NVLink 的多向高速通道技术,在 AMD 与 Intel 不可能放下竞争采纳的前提下, NVIDIA 初期找上 IBM Power 合作,虽然也攻进美国能源局成为 Summit 与 Sierra 两套系统,不过显然 IBM Power 在超算的资源与采纳度难以与 x86 抗衡。
虽然 Arm 指令集在超算领域起步较晚,也一度没有显着的成效,但由於在行动运算的成功,加上由於低功耗特性获得储存、资料中心等需求,也被如亚马逊 AWS 、微软 Azure 与百度等采用,慢慢的在相关软体环境也逐渐成熟;而至关重要的则是富士通的 FX64 处理器的问世,富士通 A64FX 是第一款在意义上为超算而生的 Arm 指令集 CPU ,从发表时被市场质疑至今仍多年蝉联 TOP500 榜单效能首位,为 Arm 指令集在超算领域奠定良好的基础。
▲虽然 NVIDIA 也曾一度想藉与PowerPC 合作建构生态圈,但成效不彰
也几乎是在 AF64 问世不久, NVIDIA 即积极启动对 Arm 架构的配套,自宣布加速运算工具全面支援 Arm 架构处理器、与合作夥伴推出基於 Arm 架构 CPU 的 HPC 参考设计,公布加速运算於 Arm 平台的表现,甚至还动念兴起收购 Arm 的计画,最终的目的即是启动基於 Arm 指令集的超算 CPU 计画,第一项成果也就是当前所看到的 Grace CPU Superchip 。
Grace CPU Superchip 虽是基於标准 Arm Neoverse 微架构为基础,不过 NVIDIA 将 NVLink 技术发展为晶粒对晶粒层级的 NVLink-C2C ,使晶粒与晶粒之间可藉由高速、低延迟的通道彼此连接,同时也能降低晶片的生产成本提供更多弹性;以 Grace CPU Superchip 与 Grace Hopper Superchip 为例,借助连接两个 72 核的 Grace CPU 实现单一 144 核 CPU ,且单一系统的 TDP 仅 500W ,抑或将 Grace 与 Hopper 连接後,使 CPU 与 GPU 具备达 900GB/s 的沟通频宽, TDP 仍仅有 1000W 层级。
▲ 2016 年公布 DGX-1 时仅有少数系统商入列
光看产品技术介绍即感受到 NVIDIA 在 HPC 等级的 CPU 来势汹汹,然而技术规格与帐面数据再好看,也需要有厂商愿意导入;回到当年 NVIDIA 2016年推出第一代的 DGX-1 之际,仅有少数的伺服器厂商愿意推出产品,但当 DGX-1 成效彰显、市场需求提高後,後续就有更多厂商愿意推出符合 NVIDIA Certified 的认证系统,市场需求才是决定产品是否广被合作夥伴采纳并量产的关键。
而 NVIDIA 在 2022 年 Computex 的主题演讲,列举多家台湾与全球知名系统业者将在 2023 年推出 Grace Hopper 生态系统的伺服器,同时还公布四大类的参考设计,不难想像 NVIDIA 应该是已经有多家潜在客户有意导入其 Grace CPU Superchip 的伺服器系统,也使 NVIDIA 能够稍微摆脱 CPU 受制於人的现况。
▲第一世代 CPU 产品即有多家系统业者宣布响应是好的开始,不过短期 NVIDIA 也不可能断然中止与 x86 的合作
当然,笔者不认为 Grace CPU 能够使 NVIDIA 彻底摆脱与 x86 CPU 的纠葛,现阶段在 HPC 的 CPU 领域 x86 架构仍有压倒性的市场偏好与需求,毕竟许多超算的基础都是建立在 x86 生态系,但考虑到包括专利等因素, NVIDIA 难以进入 x86 CPU 的开发,已经有一定基础的 Arm 指令集架构也成为 NVIDIA 实现自有超算级 CPU 最好的选择;至於 RISC-V ?首先不如先回过头来看 Arm 花了几年的时间才成功从已有行动运算的成功基础下一步一步站稳当前在超算级的地位吧。