每年的12月,我们都会对过去的一年进行复盘,对照当年立下的Flag,分析这一年里的具体执行情况,总结经验和教训,继而为来年立下新的目标。
当然,今年也不会例外。
如今,发展数字经济已经成为把握新一轮科技革命和产业变革新机遇的战略选择。随着互联网时代向人工智能时代的演进,谁掌握了AI,谁就拿到了通向未来的金钥匙。
在工业和信息时代,我国是不折不扣的追随者;而在智能时代,得益于国家层面的战略重视,以及一大批企业的倾力投入,我国实现了领导者的蜕变,AI实力已经位居全球第二。
无论对国家,还是企业来说,AI已经成为不折不扣的软实力。不过呢,软实力也需要硬实力来托举。没有强大的硬件平台,再好的AI算法也发挥不出来。
“器”之不存,AI将焉附?这一次,我们来聊AI服务器。
日前,国际权威AI基准测试MLPerf公布了最新一期训练(Training)榜单V1.1。作为全球影响力最广的AI性能基准评测,本次测试吸引了谷歌、微软云、英伟达、浪潮信息、百度、戴尔、联想等14家顶尖的公司及科研机构参与。
说句题外话,MLPerf本是一套用于测量和提高机器学习软硬件性能的通用基准,主要用来测量训练和推理不同神经网络所需要的时间,因此专业度极强,与普通人关系不大。
然而由于AI技术在各个行业的不断渗透,很多人都开始留意MLPerf榜单的发布。至于那些AI产业领域的技术公司,就更是非常认可MLPerf的权威性。
本次MLPerf AI训练性能基准评测,涵盖了8类极具代表性的机器学习任务,分别为图像分类(ResNet)、医学影像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN)、语音识别(RNNT)、自然语言理解(BERT)、智能推荐(DLRM)以及强化学习(MiniGo)。
在这一次的评测中,浪潮信息提交了AI服务器所有8项单机测试的固定任务(Closed Division)成绩。固定任务要求使用相同的模型和优化器,衡量训练/推理过程在不同软硬件上的性能,考察的主要是软硬件系统优化的能力。
在既往的测试中,浪潮信息从来不会令人失望,总会拿出格外优秀的测试成绩。令人想不到的,是在本次8项单机测试的固定任务中,浪潮信息居然能够更进一步,斩获其中的7项冠军。
其中,AI服务器NF5688M6获得医学影像分割、目标物体检测(Mask R-CNN)、自然语言理解、智能推荐4项冠军;AI服务器NF5488A5获得图像分类、目标物体检测(SSD)、语音识别3项冠军。
令人吃惊的是,与半年前的MLPerf AI训练榜单V1.0相比,本次浪潮AI服务器将医学影像识别、语音识别、智能推荐和自然语言处理任务的单机AI训练速度,分别提升了18%、14%、11%和8%。
毫无疑问,这一切与浪潮信息强大的技术实力,以及卓异的软硬件系统优化能力密切相关。
与通用服务器不同,AI服务器通常会搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合,为自然语言处理、计算机视觉、机器学习等AI应用场景提供强大的算力支持。
智能时代里,由于数据的爆炸性增长,传统以CPU为算力核心的通用服务器,已经难以满足企业的需求。经过多年的验证,搭载GPU的AI服务器已经被认为是市场的发展方向。
随着云计算、大数据需求的持续增长,市场对于AI服务器的需求不断提高。据统计,2020年全球AI服务器市场规模为122亿美元,预计到2025年将达到288亿美元,年复合增长率达到18.8%。
作为全球服务器市场的领军企业之一,浪潮信息在中国市场的份额已经连续多年位居第一。按照IDC最新的服务器市场季度报告,浪潮服务器在全球已经实现了坐二望一。
十多年前,摩尔定律的衰退已经是有目共睹。据此,浪潮认为异构加速将会成为计算产业的新方向,于是连同上下游企业,开始向AI服务器领域进军。
虽然在起初几年的回报并不尽如人意,但是浪潮信息仍是不断加大在AI服务器方面的投入。
尤为重要的是,浪潮信息并不是简单地以硬件叠加来提升产品性能,而是创造性地提出了智慧计算创新体系架构,以“硬件重构+软件定义”的模式,为新的计算模式打开了成长的天花板。
2016年,AI大潮的兴起,使得浪潮的研发成果迅速转变成为市场竞争的绝对优势,从而带来了莫大的机遇。目前,在AI服务器市场,浪潮信息则是当仁不让地占据了全球第一的宝座。
目前,浪潮已经成为国内诸多顶级互联网公司最主要的AI服务器供应商。此外,在游戏、电商、金融、交通等行业,浪潮也不断推动着产业AI化的发展。
在这种情况下,占领了技术制高点的浪潮AI服务器参加MLPerf基准测试并取得卓异的成绩,那也就是水到渠成、顺理成章了。
通常,MLCommons每年会组织2次MLPerf推理性能测试和2次MLPerf训练性能测试。本次成绩的公布,意味着MLPerf 2021年度4次性能测试正式收官。
在本年度的4次测试中,浪潮的三款明星产品——AI服务器NF5488A5、NF5688M6,以及边缘服务器NE5260M5,总计斩获了44项第一,浪潮信息也得以名列MLPerf 2021年度冠军的榜首。
其中,在MLPerf数据中心AI推理场景的总32项任务中,浪潮AI服务器斩获17项冠军;在边缘AI推理场景的总31项任务中斩获16项冠军,从云到边全面领先;在单机AI训练场景的16项任务中浪潮AI服务器共斩获11项冠军。
对于NF5488A5,大家应该不会陌生。作为全球首批上市的A100服务器,NF5488A5率先以领先的液冷和风冷散热技术,支持8颗第三代NVLink互联的A100 GPU,提供高达5 Peta FLOPS的AI计算性能和超高速带宽,为各类AI应用场景提供强大的计算力支撑。
NF5688M6则是浪潮信息面向大规模数据中心优化设计的、具备极致扩展能力的AI服务器,能够针对用户需求进行灵活适配,为语音识别、图像视频、金融分析等典型AI应用场景提供高性能、高可靠的计算力支撑。
NE5260M5通过极致优化的信号和电源等系统设计,符合ODCC的OTII标准,针对边缘数据中心极端的部署环境和所承载的业务应用,在不同层面采用了大量的优化技术,可承担NFVI、视频、AI、CDN等各类边缘应用。
那句有名的“不服跑个分”,已经成为手机圈的流行梗之一。不过至少在当前,MLPerf仍是最流行的人工智能工作负载和场景,参评跑分已经成为AI服务器最重要的评价方式之一,这可以让人们直观地了解到产品的AI能力以及系统的优化水准。
需要强调的是,浪潮信息为客户提供的并不只是硬件,而是全面的AI解决方案。通过在像MLPerf这样的竞技场上“搏杀”,以及在市场上突飞猛进,浪潮信息充分验证了自身在AI计算领域的能力,并不断推动这种能力向千行百业渗透。
以为这是个大结局?不,借用前些天上映的科幻大片《沙丘》(Part one)最后的结语:This is only the beginning.浪潮信息在当前的表现只是个开始,未来我们还将见证更多的奇迹。