三巨头激战GPU市场〖chang〗,国【guo】内厂商(shang)潜力有待发掘


现代图形处理单元 (GPU) 最初是作为 Windows 视频游戏的加速器,但在过去 20 年中已演变为用于高性能计算和人工智能应用程序的企业服务器处理器。


现在,GPU 在超级计算、人工智能训练和推理、药物研究、金融建模和医学成像中处于性能领先地位。在 CPU 不够快的情况下,它们也被应用于更主流的任务,例如在 GPU 驱动的关系数据库中。


随着对 GPU 需求的增长,为服务器制造 GPU 的供应商之间的竞争也越来越激烈。

GPU在数据中心的重要性


这三个供应商认识到数据中心对 GPU 的需求是一个不断增长的机会。这是因为 GPU 比 CPU 更适合处理企业数据中心和超大规模 *** 中人工智能和机器学习所需的许多计算。CPU可以处理工作,但需要更长的时间。


由于 GPU 旨在通过将复杂的数学问题分解为它们同时处理的单独任务来并行解决复杂的数学问题,因此它们可以更快地解决这些问题。为了实现这一点,它们具有多个内核,比通用 CPU 多得多。例如,Intel 的 Xeon 服务器 CPU 有多达 28 个内核,而 AMD 的 Epyc 服务器 CPU 有多达 64 个。相比之下,Nvidia 当前一代的 GPU Ampere 有 6,912 个内核,所有内核并行运行以做一件事:数学处理,特别是浮点数学。


GPU 的性能是通过它们每秒或 FLOPS 可以执行多少次浮点数学运算来衡量的。此数字有时指定进行测量时使用的标准化浮点格式,例如 FP64。


那么服务器 GPU 的这一年会怎样呢?事实证明,相当多。英伟达、AMD 和英特尔已经将他们的近期计划摆在桌面上,看起来这将是一场激烈的竞争。


GPU角色转变,市场爆发成必然


从全球GPU市场规模来看,根据Verified Market Research 2021年8月公布的数据显示,2021年,全球GPU市场规模为254.1亿美元。随着市场需求的不断增长,预计到2028年,这一数据将达到2465.1亿美元,年复合增长率为32.82%。可以说,不论是从市场规模,还是从未来几年的增长速度来看,GPU市场都有着不错的前景。


从细分领域来看,Jon Peddie Research(JPR)最新的数据显示,2021年第四季度,PC使用的GPU出货量(包括集成和独立显卡)达到了1.1亿片。其中独立显卡的出货量约为1300万片,环比增长3%,同比增长18%。


从厂商角度而言,在集成显卡领域,英特尔是全球更大的GPU供应商,这其中的主要因素在于英特尔的CPU和GPU是捆绑销售的,即作为集成显卡的形式运行在PC当中。而在独立显卡领域,英伟达占据了81%的市场份额,AMD则拥有剩下19%的市场份额。虽然英特尔也开始推出独立显卡,但是时间尚短,还没有形成市场规模。


无论是从集成显卡还是独立显卡的角度来看,这三家厂商几乎独占了GPU市场的绝大多数份额也就是说,在全球GPU供应商中,除了这几家之外的绝大多数厂商市场份额有限,没有太大的存在感。


除了PC使用的GPU市场之外,终端市场还以智能手机所使用的GPU为主,不过从近几年智能手机和PC市场发展的情况来看,两者是此消彼长的情况,即便是在目前疫情的态势下,PC市场出现了增长,智能手机GPU市场则不断下降,因此,从整体情况来看,终端GPU市场在近年来可以说是不断下滑。


而在这一市场之外,GPU还包括服务器,自动驾驶,人工智能等市场,但归根结底,这些市场的最终服务目标和底层技术都是人工智能,因此,在我们看来,当前的GPU市场可以简单的概括为PC/智能手机市场和人工智能市场,以及其他市场三个分类。


另一方面,根据Jon Peddie Research 2021年12月公布的数据显示,全球GPU供应商在2020年为16家,这一数字在2021年上升到了19家。


出现这一增长的主要因素在于,GPU已经不再只是特定需求场景下的特殊处理器。十多年前,GPU的主要角色还是PC当中的图形处理器,其作用是驱动电脑进行图形运算。而在当前的市场环境下,尤其是随着人工智能、机器学习功能的不断发展,机器需要处理的工作任务越来越多,计算的数据越来越大,CPU的处理方式已经无法满足计算的需求,GPU因为其特性,也就从特殊处理器,转变为了更为通用的处理器。


三巨头纷纷布局GPU市场


英伟达


英伟达在 3 月份发布了其Hopper GPU架构,并宣布了其今年的 GPU 路线图。根据使用情况,它可以提供其先前架构 Ampere 的三到六倍的性能,速度为 9.7 TFLOPS FP64。Nvidia 表示,Hopper H100 的 FP64 性能将达到 60TFLOPS。


与以前的 GPU 一样,Hopper H100 GPU 可以作为独立处理器运行,在服务器的附加 PCI Express 板上运行。但英伟达还将把它与定制的 Arm 处理器上的 CPU 配对,该处理器名为 Grace,它开发并预计在 2023 年上市。


对于 Hopper,Nvidia 所做的不仅仅是增强 GPU 处理器。它还修改了通常用于智能手机的低功耗双倍数据速率 (LPDDR) 5 内存,以创建 LPDDR5X。它支持纠错码 (ECC) 和两倍于传统 DDR5 内存的内存带宽,吞吐量为 1TBps。


与 Hopper 一起,Nvidia 宣布了其最新的 GPU 到 GPU 互连 NVLink 4。NVLink 4C2C 允许 Hopper GPU 直接相互通信,更大总带宽为 900GB——比通过 PCIe Gen5 总线连接快七倍。


“如果您考虑数据中心产品,您将拥有三个组件,并且它们都必须以相同的速度向前发展。那就是内存、处理器和通信,”Jon Peddie Research 总裁 Jon Peddie 说。“而 Nvidia 已经通过 Hopper 做到了这一点。这三种技术不会同步发展,但英伟达已经做到了。”


Nvidia 计划从 2022 年第三季度开始出货 Hopper GPU。而其OEM 合作伙伴包括 Atos、BOXX Technologies、Cisco、Dell Technologies、Fujitsu、GIGABYTE、H3C、Hewlett Packard Enterprise、Inspur、Lenovo、Nettrix 和 Supermicro。


由于其芯片制造商台积电的持续供应压力,英伟达打开了可能与英特尔的代工业务合作的大门,但警告称这样的交易将需要数年时间。


AMD


AMD 逆风而行。销售额逐季增长,x86 CPU 市场份额不断增长,2 月份完成了对 Xilinx 及其现场可编程门阵列 (FPGA)、自适应片上系统 (SoC)、AI 引擎和软件专业知识的收购. 预计 AMD 将在 2022 年底推出其 Zen 4 CPU。


AMD 基于其 RDNA 3 架构的新游戏 GPU 也将于今年推出。


AMD 一直对 RDNA 3 规格守口如瓶,但游戏爱好者的博主已经散布了未经证实的消息,即性能比 RDNA 2 提高了 50% 到 60%。


与此同时,AMD 已经开始推出用于企业计算的Instinct MI250系列 GPU 加速器,新产品比之前的 MI100 系列快得多,内存总线从 4096 位翻倍到 8192 位,内存带宽从 1.23TBps 翻了一倍多到 3.2TBps,性能从 FP64 的 11.5 TFLOPS 翻了两番多到 47.9TFLOPS。这比 AMD 的 Hopper 60TFLOPS 慢,但它仍然具有竞争力。


Futurum Research 首席分析师 Daniel Newman 表示,AMD 抢占市场份额的机会将随着 AI 市场的增长而到来。他表示,他相信 AMD 在 CPU 市场上的成功可以帮助其 GPU 销售。


“AMD 在过去五七年真正创造的是一种非常强大的忠诚度,这种忠诚度可能会延续下去,”他说。“问题是,他们能否显着增加 AI/HPC 市场份额?”


他说答案可能是“是的”,因为该公司一直非常擅长寻找市场机会和管理其供应链以实现其目标。在首席执行官 Lisa Su 的掌舵下,“我发现在他们决定在这一点上竞争的任何领域都很难排除 AMD,”他说。


Omdia 高级计算、人工智能和物联网首席分析师 Jonathan Cassell 表示,他认为 AMD 在 Epyc 服务器 CPU 方面的成功将为 Instinct 处理器提供一个机会。


“我认为,随着时间的推移,我们可以看到 AMD 在数据中心微处理器方面利用其成功,并利用这一点让公司了解 [Instinct]。我认为我们将看到 AMD 试图利用其与客户的关系来扩大其在国外的影响力,”他说。


Instinct 自 2022 年第一季度以来一直在发货。到目前为止,其最引人注目的用例是橡树岭国家实验室的一台超级计算机,它将大量性能打包到一个非常小的空间中。但这些实验室也在建造一台名为 Frontier 的全 AMD 百亿亿级超级计算机,这将于今年晚些时候部署。Instinct 提 *** 品的 OEM 合作伙伴包括华硕、ATOS、戴尔科技、技嘉、惠普企业 (HPE)、联想、企鹅计算和 Supermicro。


英特尔


长期以来,英特尔一直在努力为其台式机 CPU 制造除基本集成 GPU 之外的任何产品。对于台式机,它拥有新的 Intel Xe 系列,而服务器等效产品称为 Intel Server GPU。


现在,该公司表示今年将使用代号为 Ponte Vecchio 的处理器进入数据中心 GPU 领域,据报道该处理器在 FP64 时可提供 45TFLOPS——几乎与 AMD 的 MI250 相同,比 Nvidia 的 Hopper 落后 25%。


“这真的会破坏环境,”佩迪说。“从他们告诉我们的情况来看——我们从谣言和其他泄密事件中听到——它非常具有可扩展性。” Ponte Vecchio 将于今年晚些时候推出。


Newman 也听到了关于 Ponte Vecchio 的积极消息,但表示英特尔的真正机会在于其oneAPI 软件战略。


oneAPI 是该公司正在开发的统一软件开发平台,旨在在编译应用程序时选择英特尔制造的最合适的芯片类型(x86、GPU、FPGA、AI 处理器),而不是强迫开发人员选择一种类型的芯片并对其进行编码。它还为视频处理、通信、分析和神经 *** 等功能提供了许多 API 库。


这种抽象消除了确定更佳目标处理器的需要,以及使用不同工具、库和编程语言的需要。因此,开发人员可以专注于业务逻辑并使用 Data Parallel C++ (DPC++) 编写代码,而不是使用特定语言对特定处理器进行编码,DPC++ 是 C++ 的一种开源变体,专为数据并行和异构编程而设计。


将英特尔与 Nvidia 和 AMD 区分开来的一个因素是它制造芯片的地方。虽然其他公司使用台湾芯片制造商台积电,但英特尔在美国生产许多自己的芯片,在爱尔兰、马来西亚和以色列设有其他工厂。并且 intel有在美国建造更多晶圆厂的宏伟计划。卡塞尔说,这给了它一定的优势。“[它拥有]对自己制造的控制权使其以某种方式控制了自己的命运,”他说。“我将这些东西视为公司的资产。”


纽曼说,英伟达、AMD 和英特尔之间的竞争最终可能归结为软件竞赛。“如果你问 [Nvidia 的] 顶级工程师,他们会说我们不是一家芯片公司。我们是一家软件公司。我真的相信英特尔到目前为止还没有像软件公司那样真正考虑过人工智能,但如果他们能够正确地 [oneAPI],我看到了一些真正的机会,”他说。

中国人工智能芯片市场的需求在哪里?


那么中国厂商在GPU市场又扮演者怎样的角色呢?既然人工智能市场对于GPU的需求如此巨大,全球GPU市场规模在未来的增长速度如此迅猛,未来中国厂商的机遇又在哪里呢?


根据LeadLeo 2021年发布的数据显示,2019年,中国人工智能集成电路市场规模为90亿元人民币,根据预测,到2025年,这一数据将增长到约690亿人民币。其中,人工智能集成电路市场主要包括GPU,FPGA以及ASIC三大细分市场。不过值得注意的是,在这一市场中,GPU并不是市场份额更大的市场,ASIC由于其更为广泛的可定制性,独占鳌头。


但是正如之前所说,虽然从预测的数据来看,GPU也许不会成为中国更大的人工智能芯片市场,但是从全球的GPU市场需求和市场规模来看,GPU依然有着广阔的市场前景。


不过,在集微咨询(JW Insights)分析师团队发布的《中国半导体企业100强(2021)》中,我们能够看到的GPU设计企业或者说是专门从事GPU领域的厂商并不多,其中最为突出的则是景嘉微和兆芯。


根据公开资料显示,成立于2006年的长沙景嘉微电子股份有限公司是国产GPU的主要参与者,也是唯一自主开发并已大规模商用的企业。


景嘉微历经十余年的发展,目前已经成功研发了JM5400、JM7200、JM9为代表的系列图形处理芯片,并成功实现产业化。根据集微网2022年3月的报道显示,日前,景嘉微JM9系列图形处理芯片已顺利发布,应用领域涵盖地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示和人工智能计算领域。


而兆芯官网则显示,兆芯同时掌握中央处理器、图形处理器、芯片组三大核心技术,具备相关IP自主设计研发的能力,致力于通过自主创新与兼容主流的发展路线,为用户提供性能优越、稳定可靠的通用处理器和配套芯片,推动信息产业的整体发展。


国内厂商玩家众多,但潜力有待发掘


除了以上在《中国半导体企业100强(2021)》的两家企业之外,其实国内GPU领域的玩家众多。


例如,前不久发布了首款国产高性能4K级显卡GPU芯片“风华1号”的芯动科技;全自研、国内首款云端7nm GPGPU产品卡“天垓100”的天数智芯;以及璧韧科技、摩尔线程和沐曦集成电路等等,这些国产GPU企业几乎都是在最近几年刚刚成立,但是都是看到了国内市场对于GPU的广泛需求和未来的长久发展而出现和布局的。


但是,对于这些国内GPU厂商而言,进军GPU市场并能够扎根下来的难度依然不小。


集微咨询(JW Insights)认为,GPU由于数据计算量庞大,对于计算的效率,计算的方式有着与CPU完全不同的需求,这就造成其复杂程度要高于CPU。而纵观国外厂商,几乎都在这个领域浸淫数十年,有着深厚的技术积累和专利储备,国内GPU厂商想要在这一领域有所突破,首先就需要突破这一道门槛。


其次,由于GPU的设计更加复杂,其系统庞大,技术涉及面广。GPU的计算流程不仅涉及大量图形学,还需要有数学和逻辑分析能力,在设计和制造的过程中还需要有极其专业的团队进行支撑。也就是说,GPU不仅仅需要先进工艺的支撑,其芯片设计成本也很高,这就造成能够设计以及代工制造的企业并不多。同时,GPU的生态也是支撑其后续发展的主要因素。


综上所属,无论是技术,专利,人才还是生态对于刚刚起步的国内GPU厂商而言都不是轻易能够解决的事情。


但是也正是由于GPU广阔的市场前景,国产GPU厂商才有着更多的机遇和发展的空间。尤其是对于应用领域百花齐放的中国人工智能市场而言更是如此,庞杂的市场需求催生了各种各样的芯片需求,纵观人工智能芯片发展史我们不难看出,没有一个通用芯片能够单独解决所有问题。


当前,无论是全球还是国内的人工智能市场都处于快速发展的早期解决,市场格局也远远没有确定,虽然从当前的市场划分来看,欧美厂商凭借着长期的技术积累,牢牢占据着高端领域,但是对于国内GPU厂商而言,也并非完全没有机遇,中低端市场的需求,随着国内厂商的不断努力和建设依然大有可为。


我们认为,虽然《中国半导体企业100强(2021)》中涉及GPU的国内厂商数量并不多,其根本原因在于国内玩家起步较晚,还处于技术积累和发展早期阶段,从整个国内市场的需求和当前市场的关注程度来看,在未来的几年内,将会有越来越多的国产GPU厂商崛起。


来源:半导体行业观察,爱集微

注:文章内的所有配图皆为 *** 转载图片,侵权即删!

添加回复:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。