中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

2021-06-03 12
摘要:作者中科曙光:价值at风险400亿美元的全球超算赛道 中国力量超速发展在“新基建”东风下中科曙光,超算中心正在成为巨头们追逐的下一个风口。仅2020年初,厦门、苏州已宣布启动超算中心建设。目前,天津、深圳、……

作者中科曙光:价值at风险

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

400亿美元的全球超算赛道 中国力量超速发展

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

在“新基建”东风下中科曙光,超算中心正在成为巨头们追逐的下一个风口。仅2020年初,厦门、苏州已宣布启动超算中心建设。目前,天津、深圳、济南、长沙、广州、无锡、郑州等七地建有国家级超算中心,上海超算中心也于2000年成立,此外国内一些高等院校也建有自己的超算中心。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

在数字化崛起的时代中科曙光,政府、大企业、科研机构、高校越来越希望将海量的数据转化为可供参考的决策见解,这种需求伴随的5G、AI、物联网、大数据、云计算等新兴技术的出来变的越来迫切。由此,算力成为继带宽之后,推动科技发展的基础力量。算力金字塔的塔尖之上就是超算。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

发展至今,超算已经广泛应用在密码研究、核爆模拟、武器研制、气象气候、石油勘探、海洋环境、航空航天、宇宙模拟、材料科学、工业设计、地震模拟、人工智能、深度学习、生物医药、基因工程、动漫渲染、过程控制、数据挖掘、金融分析、公共服务等等领域,以及各种“高、精、尖” 的前沿科学中。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

据全球知名的HPC(高性能计算)咨询与服务公司Intersect360分析预测,2021年全球超算及HPC市场将达到439亿元。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

超速崛起的中国超算

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

全球竞争中,来自中国超算的声音早就不容忽视了。中国在需求方面的增长都是显著的,中国的企业也被公认为提供高性能计算机技术的顶级领导者,而全球范围内最引人注目的超级计算和大规模部署(TOP500榜单)都在中国。在超大规模的市场中,像百度、腾讯和阿里巴巴这样的组织对未来的HPC技术部署产生了重大影响,另外,还包括诸如“天蝎座”这样的行动来定义大规模部署的标准。人们普遍认为,中国将是第一个完成exaflop超级计算机部署的国家。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

在TOP 500的榜单上,中国超算的制造厂商已经从六年前不足10%的份额,逐渐增长为60%,作为中资超算企业的代表,联想全球500台最强超算中提供了182台,浪潮信息和中科曙光则分别以66和51台紧随其后,三家中国厂家的总数量为299台,几乎刚好是Top500的五分之三。中国超算中仅一个联想,就在部署数量上超过了美国。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

在部署方面,中国部署的超级计算机数量继续位列全球第一。在算力方面,联想交付的超算贡献总算力超过35.5亿亿次,位列全球第二。联想、曙光、浪潮三家头部供应商制造了 62.4% 的超算设备,提供了 26.8% 的算力。

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

中科曙光:浪潮信息中科曙光:4百亿美元的全球超算行业 中国力量超速发展

从部署数量占比和算力占比差距可以看出。在高性能计算领域内部,规模最大的超算系统和中小型超算系统之间的差距是巨大的,富士通单凭“富岳”的计算能力,就接近于其后的2~5名之和。在国产超算中的情况也是类似:93Tflops的神威太湖之光和61TFlops的天河2A同样超过典型的3TFlops的商用超算系统的30倍和20倍。这显示出超算业务的复杂性:从顶级的E级超算,到中小规模的企业超算,今天的超级计算机不仅需要强大的功能,还需要相当的可伸缩性以应对不同的客户需求,在这一背景下,联想和英特尔合作启动了“Project Everyscale”,希望将E级超算的先进技术衍生为不同规模的产品,服务更多潜在的客户。

中国超算研发机构有四个,三个在北京,一个在长沙。在长沙的是国防科技大学计算机研究所,两次问鼎世界超算冠军的“天河一号”和“天河二号”都是标准的“长沙制造”。北京的三个超算研发机构分别是国家并行计算机工程技术中心、中科院计算技术研究所,以及联想数据中心集团。其中,16年登顶世界的“神威·太湖之光”由国家并行计算机工程技术中心研制,中科院的超算品牌是“曙光”系列,联想的是“深腾”。联想企业科技集团将灵活多样的智能算力、以“海神”为代表的绿色节能以及智能数据调度和管理作为核心能力,在超算方面持续展现出了强大的技术实力。

制造世界上最快的国家级超级计算机是了不起的技术成就,但将超算技术推进产业应用也非常关键。联想作为一家商业公司,在帮助用户“挖掘算力潜力”上堪称极致。作为全球最大超算方案提供商,在过去22年中,联想不仅建立起完整的HPC产品生态,而且持续引领行业,不断创新突破自身的产品与技术。在联想集团发布的2020/21财年第三季度财报中,联想企业科技集团表现出稳健的增长趋势:数据中心业务收入达到破纪录的16亿美元,较去年增长2.1%。

在2020年11月发布的中国高性能计算Top100排行榜中,我们看到联想仍然是上榜系统最多的制造商,制造了Top100中的35台,而浪潮制造了32台,与曙光制造了22台提供了近9成的Top100系统,值得一提的是,戴尔和同方虽然各只有一台机器上榜,但排名相当靠前,戴尔制造的北京超级云计算中心A分区位居第三,同方制造的内蒙古高性能计算公共服务平台“青城之光”位居第四,显示出国内超算市场仍然存在竞争和变数。

新冠影响广泛 E 级超算元年即将开启

在过去的一年里,全球正在面临新冠肺炎危机带来的巨大挑战,经济发展放缓,全球人员流动受阻都不同成都的影响到高性能计算的发展。伴随着巨大危机的同时我们也看到许多令人惊喜的信息,富士通发布了富岳超级计算机,对E级(即100亿亿次每秒)超算发起了最有力的冲击。人工智能也在越来越多的实际场景中落地。

关注于超级计算领域的美国研究机构Intersect360在针对SC20超级计算大会的网上发布会中详细的回顾了2018到2019年间超算市场的表现,2019年全年超算市场规模达到390亿美元,相比2018年增长8.2%。

面对2020年新冠肺炎带来的危机,Intersect360在2020~2024年5年的范围内给出较为乐观的预期:即短期内由于项目取消或推迟,2020年将会出现短暂的衰退,而2021年市场将会反弹,其变化将会于2008年次贷危机之后的衰退之后大幅反弹的情形类似,而复合年均增长率(CAGR)则保持不变。

受新冠肺炎危机影响,在垂直市场方面,能源、零售和大型制造业受到的冲击是最大的。而政府订单受到的影响最小。由于北美疫情持续蔓延,2020年高性能计算市场预期衰退6.8%。目前超算服务器市场份额的领导者是慧与科技(HPE)和戴尔易安信(Dell EMC),在2016年戴尔收购易安信之后,2019年慧与科技以13亿美元收购老牌超级计算厂家克雷(Cray)目前两者的市场份额几乎相同,各占据整个市场3成的利润份额。相比2018年,2019年慧与科技及戴尔易安信利润份额都有轻微下滑的趋势,而IBM也未能保持2018年度的增长势头。在竞争者中,联想是保持年度正增长的规模最大的厂商,而Atos、Penguin Computing、浪潮和富士通则有着超过两位数的较高增长趋势。

国际市场的联想超算

联想是中国科技企业中国际化程度最高的超算提供商,在德国莱布尼茨超级计算中心,联想于2018年搭建的SuperMUC-NG使用了ThinkSystem SD650水冷节点,是2020年11月Top500中排名15位的超算系统;在意大利由多家科研及学术机构合作的CINECA,2016年联想建成Lenovo SD530/S720AP搭配了Intel Phi处理器,虽未参加最新的Top500排名,但实力仍在25和26名之间;在巴塞罗那超级计算中心,2017年建成的MareNostrum则是世界排名42位的超级计算机。

我们看到,在以亚太和EMEA(欧洲、中东及非洲)等一带一路国家市场上,联想不仅成功进入高门槛、高收益的欧洲市场,也为许多新兴市场国家提供高性价比的超级计算机和高性能计算设备:成功的案例如马来西亚气象局使用的联想NeXtScale nx360 M5集群,使用了288和节点和超过8000个处理器核,显著改善了该国的天气预报质量。

在2020年,在新冠疫情的不利影响下,联想超算仍然获得了好莱坞富于盛名的梦工厂动画公司(DreamWorks)的超算订单,与SuperMUC系统类似,梦工厂的计算集群同样使用了联想海王星(Neptune)液冷技术,根据梦工厂提供的资料,该水冷技术相比之前的风冷系统性能提升了20%。

软硬兼施 GPU和高性能存储打造E级基础设施

2020年底,联想发布了两款最新的GPU优化(GPU-rich)服务器,Lenovo ThinkSystem SD650-N V2和ThinkSystem SR670 V2,前者与之前的SD650系列类似,使用海王星水冷技术,在1U的高密度中可以安装两颗英特尔至强处理器及四个英伟达安培A100图形处理器,后者则更加侧重于提供高密度的GPU性能,支持多达8个英伟达A100图形处理器或英伟达T4张量(Tensor)处理器,其独特的液-气热交换技术也使其不需要部署额外的液冷管道而直接在传统数据中心中安装。

此外,在高性能存储领域,联想深入参与了由Intel开发的开源高性能DAOS(DistributedAsynchronous Object Storage – 分布式异步对象存储)系统,DAOS系统使用持久内存存储文件元数据并聚合较少量的输入输出操作,配合NVME固态硬盘实现高性能的存储硬件架构。在软件方面则使用了为高性能硬件专门设计的开发套件,包括持久内存开发套件(PMDK)和存储性能开发套件(SPDK)实现传统文件系统及配套软件难以达到的高访问性能,而DAOS开源的特性则让其有着广泛的中间件支持,如MPI-IO,HDF5以及Silo,MDHIM和Dataspaces等。在以超算输入、输出性能为基准的I/O500排行榜中,DAOS系统仅落后于哈尔滨工业大学鹏城实验室试验性的鹏城云脑II,仍然是目前市面上性能最高的商用存储平台。

除了全球领先的硬件平台之外,联想也为高性能计算和人工智能服务提供高性能的管理软件,即联想智能超算平台(LiCO – Lenovo intelligent Computing Orchestration),在LiCO产品指南中介绍到,LiCO除了具有一般超算平台所必备的性能监控、作业管理、资源调度、用户管理等功能外,也支持许多直接针对人工智能应用所需的管理功能,如Intel Caffe作业和TensorFlow作业管理功能,而联想加速AI则提供了图片分类、物体识别、实例分割、医疗图像分割、Seq2Seq(序列到序列,在自然语言处理等领域有广泛应用),自然语言问答,对抗网络等应用的现成模型,用户无需二次开发,即可提供数据集部署人工智能应用。

走出疫情 人工智能将引领超算发展

随着新冠疫苗在各国陆续开始使用,我们有望在2021年下半年看到广泛的经济回暖并恢复国际旅行,但有一些影响将会保持更长一段时间,如诸多企业为应对疫情而打造的云端计算系统和远程工作环境,如推特的脸书都宣布将会常态化实行远程办公。

在国内,云计算也是高性能计算机最重要的应用领域,Top100中有17套高性能计算机用于云计算,是各类应用中占比最高的,仅次于云计算的大数据应用则占据了Top100中的15席,此外视频应用以13套系统成为中国第三大应用领域。

此外,人工智能行业持续落地,高计算量,高数据密度,混合精度的计算需求将持续增长,前两者与目前高性能计算系统所能提供的资源高度吻合,而后者则正是目前GPU和异构计算架构所擅长的方向。

根据Hyperion Research的资料,19年到24年高性能数据分析(HPDA)服务器销售额的年均增长将高达15.8%,而人工智能相关应用,作为高性能数据分析最具增长性的子集,年均增长会高至31.1%,在目前看来,x86架构CPU及英伟达GPU这一组合仍是最为成熟,应用最为广泛的组合。因此在X86架构实力强劲的联想仍会在相当一段时间内保持领先优势。此外,由联想创投投资的寒武纪也在研发非GPU的人工智能芯片,我们也有望看到相关产品出现在服务器市场中。

未经允许不得转载

原文地址:http://www.newdrv.com/ss/2128.html