全球超算TOP500榜单更新 怎样才算“看懂超算”

摘要:

11 月 19 日消息 当地时间 11 月 18 日,由国际超级计算大会(ISC)公布的新一期全球超级计算机 500 强榜单出炉。中国继续扩大数量上的领先优势,在总算力上与美国的差距进一步缩小。

美国能源部下属橡树岭国家实验室开发的 Summit(顶点)以每秒 14.86 亿亿次的浮点运算速度再次登顶,与半年前的速度相同。美国能源部下属劳伦斯利弗莫尔国家实验室开发的 Sierra(山脊)、中国超算神威·太湖之光和天河二号分列二三四位。

全球超算 500 强榜单每半年发布一次。本次榜单显示,中国境内有 228 台超算上榜,在上榜数量上蝉联第一,比半年前的榜单增加 9 台。美国以 117 台位列第二,日本、法国、德国依次位居其后。这是 2017 年 11 月以来,中国超算上榜数量连续第五次位居第一。榜单显示,中国企业继续保持上榜数量优势。联想、中科曙光和浪潮位居全球超算制造商前三位。

什么是超算

超级计算机(Super computer),顾名思义,就是具有很强的计算和处理数据能力的计算机,主要特点表现为高速度和大容量,配有多种外部和外围设备及丰富的、高功能的软件系统。一般来说,超级计算机的运算速度平均每秒 1000 万次以上,存贮容量在 1000 万位以上。

从结构上看,超级计算机和普通计算机都是大同小异的,但它将大量的处理器集中在一起以处理庞大的数据量,同时运算速度比常规计算机快许多倍,进而影响到各个行业运行,其意义十分重大。

你认为是科技强国的那些国家,就是超算的强国,这两个集合是高度重叠的。这也可以反映出超算的重要性,它相当于科技界的一种基础设施。

从半年前也就是 2019 年 6 月开始,超算 TOP500 的入门门槛超过 1PFlops(每秒一千万亿次浮点运算),这是全球超算 TOP500 榜单 26 年以来的又一历史性突破。

超算怎么排名

TOP500 是按照什么来给超算排名的?当然按照计算速度了,用专业语言来说,是每秒能够执行多少次浮点运算。

当你去看 TOP500 的榜单时就会发现,对于每台超算都列出了两个计算速度,一个叫做 Rmax,一个叫做 Rpeak。例如对于目前排第一的 Summit,Rmax 是每秒 14.86 亿亿次,Rpeak 是每秒 20 亿亿次。

Rmax 是实测的最高速度,Rpeak 是理论上的最高速度。总会有些实际原因使超算的性能达不到理论上限,所以 Rmax 总是小于 Rpeak。因此,TOP500 排名用的是实测的最高速度,也就是 Rmax。

超算是不是芯片越多越强悍

在中国的超算占据首席的 5 年中,很多人对此不屑一顾。他们以为超算就是处理器堆出来的,有钱多买些处理器,计算能力就上去了。他们还以为中国的超算都是买的外国的处理器,因此计算能力再高也不值一提。

首先,超级计算机为什么算得那么快,的确是因为超算用了很多个芯片,让它们同时执行任务,也就是高性能计算的基本法则:并行计算。

超算的单个芯片的性能跟个人电脑的芯片差不了太多,而让多个芯片进行工作,要先给它们划分好任务,这个任务划分是要消耗时间的。当各个芯片开始计算之后,还不时地要和其他芯片交换数据,数据通信,这是也是要消耗时间的。

因此,当芯片很多的时候,任务划分和数据通信会变成瓶颈因素,由此可见,芯片并不是越多越好,光靠堆芯片是堆不出超级计算机的,就跟企业越大,组织层级越多,办事效率就越低一个道理。

一台超算能够容纳下多少芯片,并不是取决于你能买到多少芯片,而是取决于系统架构。只有拥有好的系统架构,你才能拥有更多芯片,也就能拥有更大的算力,所以芯片数增加不是超算升级的原因,而是结果。除了芯片之外,架构同样也是核心技术。

那么中国超算用的是国产芯片吗

其次,来说说国产芯片的问题。TOP500 上的第三和第四,也就是神威太湖之光和天河二号,它们现在用的都是国产芯——注意是现在。

神威太湖之光用的是中国自主研发的“申威26010”众核处理器。它的出现击碎了外界对于超算芯片国产化的质疑。

天河二号以前用的是英特尔的 Xeon Phi(至强融核)芯片,在它连续四次夺冠后,2015 年 4 月,美国商务部禁止英特尔公司向中国国家超级计算广州中心出售至强芯片。长沙中心、广州中心、天津中心和国防科技大学这四家国家超算中心,均被美国列入了出口管制名单。

面对来自美国的扼杀,天河二号在 2017 年底用国产的 Matrix-2000 协处理器替换了用了五年的 Xeon Phi。这次升级把天河二号的每秒计算次数从 3.39 亿亿次提升到了 6.14 亿亿次,而功耗只增加了不到 4%。所以六年了,天河二号还能在 TOP500 上排到第四,可以说相当出色。

另外还要说一句,天河二号取得突破的关键之一是中国自制的 TH Express-2 主干拓扑结构网络连接,这项技术世界领先。所以说,构架也是核心技术就这个道理。

当然你可能又有话要说了,那其他的超算呢?事实上,出于商业和应用上的考虑,不管是中国还是美国,大多数企业部署的超算都趋向于采用成熟的芯片,比如本期 TOP500 榜单中,94% 都使用了英特尔 Xeon(至强)或 Xeon Phi(至强融核)处理器。这是美国在计算机芯片研制方面的绝对优势,中国短时间内很难打破。

超算到底有什么用

很多人会问超算到底有什么用。回答是当然非常有用了,不然全世界的科技强国纷纷制造超算干嘛呢!

超算在情报收集、破解领域能力领先,可以强行攻破对方的安全系统,棱镜计划暴露了美国政府对公众隐私和他国公民个人数据的庞大监控,这些海量情报需要进行处理,就要用到超算。

说个离老百姓近的例子,现在的天气预报为什么总那么准,就是超算对云层进行精确的模拟和观测的结果。通过超算模拟还可以计算未来一段时间内大气污染物浓度和分布,进行空气质量报告。

而我们用到的很多先进技术——比如处理器技术、虚拟技术包括未来的量子计算,最早都是超算先用,然后才普及为民用。目前的云计算和大数据同样也需要超算的算力支持。

医疗领域,超算已经在用于肿瘤研究、DNA 测序和药物研发等等。此外超算还用于核业、军事、航天等高科技领域。

总之,大到模拟宇宙的演变,小到测算一个分子结构,超算发挥作用的地方可太多了。

超算界有一个最高级荣誉——当然不是这个 TOP500 排名了——叫做戈登·贝尔奖(Gordon Bell Prize),是授予最杰出的高性能计算应用的,每年颁发一次。获得戈登·贝尔奖的应用,一般都在最快的超算上运行。

基于神威·太湖之光的两项应用“千万核可扩展全球大气动力学全隐式模拟”、“非线性地震模拟”分别在 2016 年和 2017 年获得戈登·贝尔奖。其中非线性地震模拟,模拟的就是唐山大地震。

中国超算什么时候能重回第一

神威太湖之光曾经在从 2016 年 6 月到 2017 年 11 月的四期 TOP500 榜单中排在首位,四连冠。

天河二号曾经在 2013 年 6 月至 2015 年 10 月的六期榜单中六连冠,直到 2016 年 6 月让位给神威太湖之光,然后一直保持亚军。

而美国重新夺回 TOP500 的第一名已经是 2018 年 6 月的事了,当时外媒铺天盖地地报道,国内也有不少人关注。

自从 TOP500 开始发布的 1993 年以来,美国曾经不止一次地失去速度最快的桂冠,但始终保持着上榜数最多的地位。到了 2017 年 11 月,中国第一次在上榜数目上登顶,美国失去这个第一。在最新的榜单中,中国扩大了上榜数目的优势,在总算力上接近美国,美国超算占比为 37.1%,中国超算占比为 32.3%。而半年前,这个数据是美国 38.4%,中国 29.9%。

从这一点看,中国超算已经相当强悍,而且继续发展下去很快会在总算力上超越美国。如果你要问中国超算什么时候拿回 TOP500 的第一名,机会不久就会到来,那就是世界超算格局的新变化之一:E 级超算的出现。

E 级超算,即百亿亿次超算,被公认为超级计算机界的下一顶皇冠。从 Summit 的每秒近 15 亿亿次浮点运算速度到百亿亿次,这中间有相当大的发展空间,到 E 级超算实现时,将会出现全新的榜单。

美国对此高度重视,相继宣布建造“极光”、“前沿”和“酋长岩”三台 E 级超算,交付时间预计为 2021 年至 2023 年。

中国也在已经开始 E 级超算部署三连发,其中 E 级超算“天河三号”原型机 2018 年 7 月已开放应用,“天河三号”有望于 2020 年研制成功。神威 E 级原型机和曙光 E 级原型机系统也已完成交付。

下一个第一,不出意外的话应该就在这几个名字之间诞生,我们拭目以待。

而大家在关注第一的时候也应该清楚,科技竞争不等于战争,并没有真正意义的失败者,只要你参与竞争,就能从中获得科技进步,分享科技成就。在超算领域,我们已经是国际上数一数二的竞争者,这本身就非常了不起。而在超算的竞争中,我们同样能在高性能芯片、构架系统、软件应用等众多方面积累领先的成果,实现最终理想。

活动入口:

天翼云大促领万元红包 爆款云主机仅需79元/年

阿里云 - 云大使推广活动 每单返现高达23-31%

查看评论
created by ceallan