GPU(graphics processing unit)已经成为现代计算架构中不可或缺的组成部分,它最初被用于处理复杂的图形和视觉信息,在3D渲染、图像处理和视频解码等领域展现出了卓越性能。
随着数据的爆发式增长,GPU的并行计算能力得到了深入挖掘,用于更广泛的计算任务。这一转变,既标志着GPU架构的跨越式演进,也标志着通用计算领域的一个重要里程碑。近年来,全球GPU市场迎来快速发展。
在这一背景下,国产GPU积极探索在专用图形加速、通用并行计算领域的发展,技术创新、产品性能和市场应用都取得了一定的进展。预计到2027年,我国GPU市场规模有望达到345.6亿美元。
超越图形,GPU架构由专用走向通用
GPU是专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的处理器,最初用在PC和移动端上运行绘图运算工作,与CPU集成,以集成显卡(核显)的形态发挥功能。
对GPU通用计算进行深入研究从2003年开始,并出现了GPGPU概念,“GP”表示通用目的(General Purpose),GPGPU一般也被称为通用图形处理器或通用GPU。NVIDIA于2007年率先推出了独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代码。
在GPU走向通用计算的过程中,统一渲染架构的出现非常关键。统一渲染单元是一个高性能的浮点和矢量计算逻辑,它具有通用和可编程属性。由此,GPU不再有单独的顶端渲染单元和像素渲染单元,而是由一个通用的渲染单元同时完成顶点和像素渲染任务。
基于统一渲染架构,GPU中的可编程计算单元Shader(着色器)core被挖掘出了更多的使用方法,比如通用计算。GPU从若干专用的固定功能单元(Fixed Function Unit)组成的专用并行处理器,进化为以通用计算资源为主、固定功能单元为辅的架构,这一架构的出现奠定了GPGPU的发展基础。
不过,虽然都是由GPU架构演进而来,但关注的重点有明显区别,GPU的核心价值体现在图形图像渲染,GPGPU的重点在于算力。GPGPU架构设计时,去掉了为图形处理而设计的硬件加速单元,保留了GPU的SIMT架构和通用计算单元,使之更适合高性能并行计算,并能使用更高级别的编程语言,在性能、易用性和通用性上更加强大。
二者各有其技术和生态门槛,对于从业企业来说,体系结构与算法是核心壁垒。全球GPU专利持有数量排名前三的是NVIDIA、Intel和AMD,与之相比,我国GPU企业入局晚、专利数量少且布局主要在国内。
GPU国产之路已开启
国产GPU于2017年之后进入高投入期,特别是2020年前后,多家创业公司成立,主要面向图形渲染和AI计算进行技术布局。GPGPU代表厂商有海光、壁仞、沐曦、登临、天数智芯等,图形渲染代表厂商有景嘉微、摩尔线程(两个方向均有布局)、芯动科技等,主要以信创产业链企业和初创企业为主。<与非研究院>对国产GPU企业进行了梳理(附图见文末)。
1、 国产GPU进入创业高峰期
与技术进步、市场需求增长以及政策支持等因素相关,2020年之后,我国GPU进入创业高峰期。<与非研究院>对主要的国产GPU企业进行了梳理(附图见文末)。
从早期探索到快速增长,再到当前的创业高峰期,我国GPU产业整体呈现出活跃的创新氛围,目前呈现成熟与新兴企业并存的格局。
2、 国产GPU处于融资活跃期
从已梳理企业的融资/上市情况来看,处于天使轮前后、A轮前后、B轮前后的企业数量最多,这也符合我国GPU产业当前的发展情况,仍处于相对早期的阶段。具体情况见文末附图。
不过,初创GPU企业的融资活跃度,也反映出我国GPU产业正在经历快速成长期。这些处于早期融资阶段的企业通常更加注重技术创新和投入,这也意味着我国GPU产业正在积累技术实力,为未来的突破和成熟打下基础。同时,GPU产业尚未形成稳定的市场格局,行业竞争和整合可能会进一步加剧。
3、 国产GPU地域分布较广
从国产GPU企业的地域分布来看,正在全国范围内逐渐展开,其中上海7家、武汉3家、南京3家、深圳2家、北京1家、天津1家、长沙1家、珠海1家、西安1家、重庆1家。主要集中在具有科技和经济优势的地区,以一线城市和科技中心为主,总体来看具备一定的地域多样性(附图见文末)。
4、产品布局走向多样化
梳理21家国产GPU企业的技术路径,其中,6家企业致力于专用架构的图形图像GPU产品开发,5家专注于通用并行架构的GPU开发,10家则是专用+通用并行的产品开发模式。<与非研究院>对主流的图形GPU和通用GPU都进行了整理和对比(附图见文末)。
重点关注国产GPU三大机遇
1、信创
从2019年我国提出发展信创产业,到2021年信创开始迈向行业深水区,逐渐延伸到金融、电信等重点行业、核心业务,我国信创产业规模持续扩大。2021年,信创产业规模达6886.3亿元,近五年复合增长率为35.7%,预计2025年有望突破2万亿,其中IT硬件和基础软件构成的核心市场规模将达到6920亿。
GPU作为信创产业的核心硬件之一,可为政府、金融、电信等行业提供自主可控的图形处理和高性能计算能力。
一方面,国产GPU在信创领域的生态布局在加强,比如近期智绘微电子的二代桌面显卡与飞腾腾锐处理器完成兼容性适配认证,表明二者搭配能够良好运行,为信创国产化应用提供良好的计算能力;另一方面,信创领域的新机遇值得关注,特别是运营商近两年在服务器的集采方面,国产化率不断提升。
从运营商近两年的投资情况来看,中国移动2023—2024年新型智算中心(试验网)集采项目,12个标包对应AI训练服务器采购量总计达到2454台(1-11标包集采1204台,12标包集采1250台);中国电信2022年至2023年服务器集采的国产化率约为27%,2023年10月公布的AI算力服务器(2023年至2024年)集中采购项目评审结果显示国产化率约为47%;中国联通也已开启2024年AI服务器集采,数量分别为4175台、2503台。运营商项目有望为国产GPU企业带来更多机会。
2、数字孪生
随着越来越多的企业和机构开始数字化转型,利用数字技术来改进运营、增强客户体验、创新产品和服务等,数字孪生将在这一过程中发挥重要作用,比如:帮助企业全面理解和优化业务流程、进行预测性维护、提高决策质量、加速产品开发、提升灵活性和适应性等等。
在数字孪生方面,GPU的应用机遇主要体现在以下几个方面:
- 实时渲染能力:GPU提供的实时渲染能力对于创建精确的数字孪生模型至关重要。它可以快速生成高质量的图像,使用户能够即时看到变化和交互的效果;
- 复杂场景模拟:数字孪生经常用于模拟复杂的工业场景,如生产线、交通系统或城市环境,GPU的并行处理能力可以高效地处理这些场景中的大量数据和复杂计算;
- 虚拟现实(VR)和增强现实(AR):数字孪生结合VR和AR技术,可以提供更加沉浸式的体验,GPU可提供必要的图形处理能力;
- 云渲染服务:随着云计算的发展,基于云的GPU渲染服务为数字孪生提供了更灵活的资源配置和更高的可扩展性。
在这一领域,国产GPU可继续提升图形处理和并行计算能力,为数字孪生提供技术基础;加速数据分析和可视化过程,提高数字孪生模型的响应速度和精确度;提供性价比更高的解决方案,降低企业在数字孪生技术应用中的成本;提升国内数字孪生技术应用的自主可控能力,保障数据安全和产业安全。
3、AI智算
新型智算中心是以高性能GPU、AI加速卡等集群算力为核心,集约化建设的新型算力基础设施。
工信部发布的《新型数据中心发展三年行动计划(2021-2023年)》,已经明确了算力内涵并引入测算指标FLOPS,对数据中心发展质量进行评价,行动计划指出:到2023年底,总算力规模将超过200 EFLOPS,高性能算力占比将达到10%;到2025年,总算力规模将超过300 EFLOPS。
六部门发布的《算力基础设施高质量发展行动计划》,进一步明确了顶层算力的建设节奏。其中提及,2023年至2024年智算建设缺口为23EFlops,2025年全国算力目标超过300EFlops,智算比例达到35%,智算算力目标为105EFlops。
目前,国内在8个地区建设国家算力枢纽节点,并规划了10个国家数据中心集群,以构建国家算力网络体系。截至2023年底,国内智算中心项目为128个,其中83个项目披露规模,规模总和超过7.7万P。另外,2024年共有39个智算中心项目已投产。
由于GPU更适合处理超大规模智算中心中AI和机器学习所需的计算类型,因此,智算中心的建设对GPU来说是一个不断增长的机会。
根据IDC的《中国半年度加速计算市场(2023全年)跟踪》报告,2023全年,中国加速服务器市场规模达到94亿美元,同比2022年增长104%。其中GPU服务器依然是主导地位,占据92%的市场份额,达到87亿美元。其余NPU、ASIC 和 FPGA等非GPU加速服务器占据近8%的市场份额,超过7亿美元。
从国际环境来看,美国对相关技术及产品的管控,虽然在一定程度限制了中国AI产业的发展,但同时也激发了中国本土厂商自研芯片的积极性。从市场与产业链角度看,在AI行业与算力市场不断发展的背景下,市场对于AI服务器的需求不断增大,将持续推动AI服务器的销量增长,也将带动国产GPU的落地应用。
另一方面,大模型的落地对于AI基础设施市场有明显带动作用。语音识别、人脸识别、文字生成、图文创作等应用已经从研究模型走向落地,大模型应用在日常生产生活中的作用越来越明显。基于对海量数据的训练和对模型的不断调优,AI大模型具有更精准的执行能力和更强大的场景可迁移性。
2024年,我国政府致力于产业数智化转型,AI大模型有望在城市治理、工业制造、农业生产等综合场景中广泛应用、并提供更好的方案。
这些大模型广受关注的同时,对于训练型AI服务器的算力提出了更大的要求,以此为目标导向,国产GPU紧抓国产化趋势,有望开始新一轮高速发展周期。
总结
除了信创、数字孪生、AI智算等领域,国产GPU在游戏、智能驾驶、边缘计算等领域也前景广阔。
就游戏来说,比如PC游戏、云游戏等,对GPU的图形处理能力提出了更高要求,且云游戏需要强大的服务器端GPU来处理图形渲染任务,都需要相匹配的GPU计算资源;对智能驾驶而言,大量来自多种传感器的复杂计算任务,以及对于深度学习模型进行加速准确性和可靠性的训练,都对GPU有一定需求;边缘计算方面,出于低延迟处理、分布式计算、以及实时的数据分析与决策需求,相关技术和设施建设正在快速发展和投入。
这些领域都为国产GPU提供了新的增长点和应用场景,特别是随着自主可控的计算需求日益增长,国产化势在必行,国产GPU需要不断迭代并提升性能,推动产业化进程的加速落地。