CPU研究报告系列6. 详解六大国产CPU之 鲲鹏

2024-09-02 10:22

鲲鹏:获得ARMv8永久授权,自主能力较强

华为芯片基于ARM架构,研发五大芯片族,实现全场景布局。华为自研芯片产品主要包括服务器芯片鲲鹏系列、手机SOC芯片麒麟系列、人工智能芯片昇腾系列、5G基站芯片天罡系列、5G终端芯片巴龙系列等,以及一系列专用芯片,如凌霄芯片、NB IoT芯片、视频编码解码芯片以及SSD控制芯片等。

在不断加剧的国际封锁和美国实体清单的负面影响下,鲲鹏的发展蒙上了一层不确定性。


鲲鹏发展历程

鲲鹏处理器基于ARMv8指令集永久授权,自主研发设计处理器内核,兼容全球ARM生态,并围绕鲲鹏处理器打造了“算、存、传、管、智”五个子系统的芯片族,实现全场景处理器布局。

华为从2004年开始投资研发第一颗嵌入式处理芯片,历经16年,累计投入超过2万名工程师,形成了目前以“鲲鹏+昇腾”为核心的基础芯片族。



鲲鹏计算产业发展蓝图

试点阶段通过在政务、电信、金融和互联网等行业选取典型场景进行产业使能、孵化和试点,通过试点建立产业界上下游厂家和用户的信心。

推广阶段面向政务、电信、互联网、广电、金融证券、电力、能源、交通等行业全面打通产业体系,为行业数字化业务创新提供基础。

深化阶段面向全行业,全场景,打通产业链,构筑基于鲲鹏处理器的产业体系。


国产最早7纳米ARM服务器:鲲鹏920处理器

2019年,华为发布了最新的鲲鹏920处理器,该芯片支持ARMv8.2指令集,“业内性能最高”,行业内首款7nm数据中心ARM处理器专为大数据处理以及分布式存储等应用而设计。

鲲鹏920由华为自主研发设计,采用多发射、乱序执行、优化分支预测等多种手段提升单核的性能。鲲鹏92064个内核,集成8通道DDR4,可以提供多个接口,主频可达2.6GHz,总内存带宽最高可达1.5Tb/s,支持PCIe 4.0CCIX接口,总带宽640Gbps。华为Cache一致性总线(HCCS)的480Gbps片间互联支持最多四颗鲲920互联和最高256个物理核的NUMA架构,保证了鲲鹏920超强算力的高效输出。此外,在Memory子系统上也进行了大量的优化,采用当前典型的3Cache的架构,对Cache大小以及延时进行了优化设计。


鲲鹏920处理器性能对比

鲲鹏920芯片算力维度方面在非X86架构芯片中明显领先,且发展至目前已经达到可以与X86芯片相匹配的性能。

目前从整体性能上看,鲲鹏920与芯片龙头Intel公司所生产的芯片相比较而言,48核的鲲鹏920Intel至强8180性能相当,但鲲鹏920能耗比对方低20%,而64核的鲲鹏920测试性能要优于Intel至强818033%左右。这证明ARM架构已经在特定领域具备赶超X86架构性能的能力。