搜索
写经验 领红包

人工智能服务器:高算力核心底座,龙头全梳理

人工智能服务器:高算力核心底座,龙头全梳理,人工智能服务器配置

随着大数据、云计算、人工智能等技术的成熟与在各行各业的应用,AI服务器价值凸显。

AI服务器专为人工智能训练和推理应用而设计,大模型带来算力的巨量需求,有望进一步推动AI服务器市场的增长。

据IDC预测,2023年AI服务器训练需求占比达41.5%,随着大模型的应用,该比例在2025年将降低至39.2%。将GPT-4的推算结果作为训练需求,进一步推算2023/2025年推理需求最高达44081/48502 PFlop/s-day。

IDC预计2025年全球人工智能服务器市场规模将达到266亿美元,五年复合增长率为18.9%。

人工智能服务器:高算力核心底座,龙头全梳理

人工智能服务器行业概览

服务器一般可分为通用服务器、云计算服务器、边缘服务器、AI服务器等类型。

AI大模型对算力的需求分别来自训练和推理两个环节。

1)训练环节:通过标记过的数据来训练出一个复杂的神经网络模型,使其能够适应特定的功能,模型具有一定的通用性,以便完成各种各样的学习任务。该环节需要处理海量的数据,注重绝对的计算能力。

2)推理环节:利用训练好的模型,使用新数据推理出各种结论。借助神经网络模型进行运算,利用输入的新数据来一次性获得正确结论的过程。该环节对算力要求比训练环节略低,但注重综合指标,单位能耗算力、时延、成本等都要考虑。

AI服务器相较于高性能服务器、基础服务器在芯片组的价格往往更高,AI服务器(训练)芯片组的成本占比高达83%、AI服务器(推理)芯片组占比为50%,远远高于通用服务器芯片组的占比。

AI大模型对于算力(服务器)的需求:

人工智能服务器:高算力核心底座,龙头全梳理

AI服务器分类方式有两种:

1)按应用场景:AI服务器按照应用场景可以分为深度学习训练型和智能应用推理型。

训练任务对服务器算力要求较高,需要训练型服务器提供高密度算力支持,典型产品有中科曙光X785-G30和华为昇腾Atlas 800(型号9000、型号9010)。

推理任务则是利用训练后的模型提供服务,对算力无较高要求,典型产品有中科曙光X785-G40和华为昇腾Atlas 800(型号3000、型号3010)。

2)按芯片类型:AI服务器为异构服务器,可以根据应用范围调整计算模块结构,可采用CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多种加速卡等组合形式。

人工智能服务器:高算力核心底座,龙头全梳理

资料来源:昇腾计算官网、中科曙光

以前,AI计算基础设施主要都使用的是X86服务器。但是,随着AI算法和芯片的发展,GPU、FPGA以及ASIC芯片为核心计算单元的AI专用基础设施增多。

目前,产品中最常见的是CPU+多块GPU的方式。

常见的AI服务器分为四路、八路、十六路。

一般来说,通用服务器主要采用以CPU为主导的串行架构,更擅长逻辑运算;而AI服务器主要采用加速卡为主导的异构形式,更擅长做大吞吐量的并行计算。按CPU数量,通用服务器可分为双路、四路和八路等。

虽然AI服务器一般仅搭载1-2块CPU,但GPU数量显著占优。按GPU数量,AI服务器可以分为四路、八路和十六路服务器,其中搭载8块GPU的八路AI服务器最常见。

人工智能服务器:高算力核心底座,龙头全梳理

GPU服务器超强的计算功能可应用于海量数据处理方面的运算,如搜索、大数据推荐、智能输入法等,相较于通用服务器,在数据量和计算量方面具有成倍的效率优势。

此外,GPU可作为深度学习的训练平台,优势在于:1、GPU 服务器可直接加速计算服务,亦可直接与外界连接通信;2、GPU服务器和云服务器搭配使用,云服务器为主,GPU服务器负责提供计算平台;3、对象存储COS 可以为GPU 服务器提供大数据量的云存储服务。

当前各行业与人工智能技术的深度结合及应用场景的不断成熟与落地,使人工智能芯片朝着多元化的方向发展,为了迎合芯片的多元化,服务器的类型也将越来越丰富,并适用越来越多的行业应用场景。

人工智能服务器:高算力核心底座,龙头全梳理

资料来源:阿里云官网

人工智能服务器市场格局

根据国际数据公司IDC发布的2021H2《全球人工智能市场半年度追踪报告》,2021H1全球AI服务器市场规模156亿美元,浪潮信息在世界AI服务器市场占有率达20.9%,份额同比提升3.6pct,销售额同比增长68.3%,蝉联全球第一。

另外,据IDC发布的《2021年下半年度(H2)中国加速计算服务器市场报告》,在中国市场,浪潮AI服务器占有率达52.5%,连续5年保持中国AI服务器市场份额超过50%。

2021H1全球AI服务器市场份额比例:

人工智能服务器:高算力核心底座,龙头全梳理

资料来源:IDC

行行查 | 行业研究数据库 资料显示,国内人工智能服务器代表厂商中,浪潮信息是全球领先的服务器生产商,拥有全面的AI 计算产品阵列以及性能领先的Transformer训练服务器,具备从芯片、板卡、整机到平台软件的全栈AI计算方案提供能力;2022年MLPerf基准评测中浪潮AI服务器获超半数赛道的冠军;浪潮NF5688M6是目前公司算力最强的AI服务器之一,主要用于超大规模数据中心。

中科曙光是国内高性能计算领域的领军企业,亚洲第一大高性能计算机厂商,大力发展云计算、大数据、人工智能、边缘计算等先进计算业务,构建了完整的AI计算服务体系,参建国内多家超算中心和智算中心。

中科曙光目前AI服务器分为训练和推理两种,主要采用海光/寒武纪芯片,目前已和百度“文心一言”展开合作,为其产业化应用提供算力支持。

人工智能服务器:高算力核心底座,龙头全梳理

拓维信息是华为昇腾AI战略合作伙伴、华为全方位战略合作伙伴,在“鸿蒙+鲲鹏+昇腾”基础软硬件领域和华为构建全面合作;其中兆瀚系列AI服务器是基于华为达芬奇架构3D Cube技术的昇腾AI处理器;兆瀚AI服务器涵盖训练、推理等领域,目前广泛应用于智慧城市、运营商等行业的数据中心、算力中心相关场景。

神州数码拥有国内领先的云计算产业相关服务技术优势和国内最大的To B销售网络渠道,云管理服务已经覆盖全球五大公有云,形成了全面的云和数字化生态整合能力;并率先提出“数云融合”理念,并将“数云融合”作为企业数字化转型的方法框架;神州鲲泰系列AI服务器覆盖训练、推理和边缘三种类型,均采用鲲鹏920处理器,成为鲲鹏产业生态的重要实践者,积极布局基于“鲲鹏+昇腾”的自有品牌体系。

工业富联在云计算服务器出货量持续全球第一,并推出新一代云计算基础设施解决方案(模块化服务器、高效运算HPC)以解决AIGC算力井喷需求;其客户布及全球,覆盖微软、谷歌、英伟达、英特尔等海外头部大厂;工业富联云计算产品涉及云服务器、高性能服务器、AI服务器、边缘服务器及云储存设备等。

人工智能服务器:高算力核心底座,龙头全梳理

紫光股份致力于打造“云—网”产业链,向云计算、移动互联网和大数据处理等信息技术的行业应用领域全面深入,目前核心业务基本覆盖IT服务的重要领域;紫光股份对子公司新华三剩余49%的股权收购有望能在今年内完成,正持续推进;新华三是目前国内前三、全球前十的AI服务器厂商,其相关产品包括UniServer AI一体机和一系列AI服务器等,新华三AI服务器在MLPerf训练及推理测试中共斩获86项世界第一,具备深厚技术积淀和领先实力。

2017年开始,随着边缘计算、“物联网+”的兴起,叠加AI等需求,服务器市场开始火热。

根据IDC数据,十五个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5‰和1.8‰,预计该趋势在2021-2025年将继续保持。

此外,当一个国家的计算力指数达到40分以上时,国家的计算力指数每提升1点,其对于GDP增长的推动力将增加到1.5倍,而当计算力指数达到60分以上时,国家的计算力指数每提升1点,其对于GDP增长的推动力将提高到3.0倍,对经济的拉动作用变得更加显著。

AI服务器专精于海量数据处理和运算方面,其可以为人工智能、深度学习、神经网络、大模型等场景提供广阔的动力源泉,并广泛应用于医学、材料、金融、科技等千行百业。在迎新一轮人工智能的浪潮下,AI服务器有望同步高增长,迎来广阔的市场空间。

关注乐晴智库,洞悉产业格局!