对于我们大多数人来说,如果一台计算机能够以60fps的速度运行 8K 视频或最新版本的《孤岛惊魂》而不会变慢,那么它可能看起来已经足够快了。然而,有许多复杂的任务需要每秒进行数十亿次计算——这是配备 i9 处理器的台式机无法完成的。

这就是超级计算机派上用场的地方。它们提供了高水平的性能,使政府和组织能够解决传统计算机无法解决的问题。

今天的超级计算机在构建时就考虑到了 AI(人工智能)工作负载。除了天气预报、气候研究、物理模拟和石油和天然气勘探外,超级计算机还帮助科学家发现更具弹性的建筑材料,并以极端的细节水平研究人类蛋白质和细胞系统。

通常,超级计算机的性能以每秒浮点运算 (FLOPS) 来衡量。在科学计算领域,FLOPS 是一个比测量每秒指令数更准确的数字。

您知道吗?第一台超级计算机——利弗莫尔原子研究计算机——是在 1960 年为美国海军研发中心建造的。

为了向您展示我们从那时起已经走了多远,我们整理了一份世界上最快的超级计算机的详细列表。它们都是在 Linux上运行的非分布式计算机系统。

12. 红杉

速度:17.1 petaFLOPS

核心数:1,572,864

供应商:IBM

地点:美国劳伦斯利弗莫尔国家实验室

Sequoia 使用 IBM 的 BlueGene/Q 服务器提供 20 petaFLOPS 的理论峰值性能。与上一代 K 计算机相比,它的内核数量增加了 123%,能源效率提高了 37%。

尽管该机器主要用于核武器模拟,但它也可用于许多科学目的,例如气候变化和人类基因组分析。它还通过对人类心脏电生理学的 3D 模拟展示了其强大的可扩展性。

11. 盘古三

信用:Total S.A.

速度:17.8 petaFLOPS

核心数:291,024

供应商:IBM

地点:法国波城CSTJF技术和科学研究中心

Pangea III 依赖于 IBM 的 AI 一体化的高性能架构。 IBM 和 NVIDIA 合作构建了业界唯一的 CPU 到 GPU NVLink 连接,与基于 x86 的传统系统相比,IBM POWER9 CPU 和 NVIDIA Tesla V100 Tensor Core GPU 之间的内存带宽提高了 5 倍以上。

该架构不仅提高了计算性能,还提高了能效。新系统使用的每 petaFLOP 能耗不到其前身 Pangea I 和 II 的 10%。

Pangea III 具有多种应用,特别是在三个不同的领域——勘探和开发地震成像、开发和生产模型以及资产估值和选择性。

10. 拉森

速度:18.2 petaFLOPS

核心数:288,288

供应商:IBM

地点:美国劳伦斯利弗莫尔国家实验室

Lassen 被指定用于未分类的模拟和分析。它安装在同一个实验室中,并且使用与 Sierra(#2 最快的超级计算机)相同的构建组件。

尽管 Sierra 是一个庞大的系统,但 Lassen 本身就是一个不错的尺寸:它正好是其较大尺寸的 1/6。 Lassen 系统包含在 40 个机架中,而 Sierra 占用了 240 个机架。

IBM Power9 处理器和 253 TB 的主内存帮助 Lassen 实现了 23 petaFLOPS 的振奋性能。

9. SuperMUC-NG

速度:19.4 petaFLOPS

核心数:305,856

供应商:联想

地点:德国莱布尼茨超级计算中心

SuperMUC-NG 具有 6,400 个联想 ThinkSystem SD650 直接水冷计算节点,具有超过 700 TB 的主内存和 70 PB 磁盘存储空间。

它连接到强大的可视化系统,其中包含一个大型 4K 立体 Powerwall 和一个 5 面 CAVE 人工虚拟现实环境。

这台超级计算机为许多领域的欧洲科学家提供服务,包括基因组分析、流体动力学、量子力学、生命科学、医学和天体物理学。

8. AI 桥接云基础设施

信用:ABCI

速度:19.8 petaFLOPS

核心数:391,680

供应商:富士通

地点:日本国立先进工业科学技术研究所

这是世界上第一个提供 32.577 petaFLOPS 峰值性能的大规模开放 AI 计算基础设施。它共有 1,088 个节点,每个节点包含 2 个 Intel Xenon Gold 可扩展处理器、4 个 NVIDIA Tesla V100 GPU、2 个 InfiniBand EDR HCA 和 1 个 NVMe SSD。

富士通有限公司声称,该超级计算机通过使用热水和空气冷却,可以实现传统数据中心 20 倍的热密度,以及 70 kW Rack 的冷却能力。

7.三位一体

速度:21.2 petaFLOPS

核心数:979,072

供应商:克雷

地点:美国洛斯阿拉莫斯国家实验室

Trinity 旨在提供非凡的计算能力国家核安全局核安全企业。它旨在提高核武器模拟代码中的几何和物理保真度,同时确保核库存的安全、可靠和有效。

超级计算机的开发分为两个阶段:第一阶段采用英特尔至强 Haswell 处理器,第二阶段包括使用英特尔至强融核 Knights Landing 处理器的显着性能提升。它可以提供超过 41 petaFLOPS 的总峰值性能。

6. Piz Daint

速度:21.2 petaFLOPS

核心数:387,872

供应商:克雷

地点:瑞士国家超级计算中心

这台超级计算机以瑞士阿尔卑斯山的 Piz Daint 山命名,运行在 Intel Xeon E5-26xx 微处理器和 NVIDIA Tesla P100 上。

Piz Daint 利用 DataWarp 的“突发缓冲模式”来增加进出存储设备的有效带宽。这加快了数据输入/输出速率,促进了数百万个小型非结构化文件的分析。

除了日常任务外,它还可以处理一些世界上数据最密集的项目的数据分析,例如从大型强子对撞机实验中收集的数据。

5. 弗龙特拉

两排 Frontera 服务器之间的视图 |信用:TACC

速度:23.5 petaFLOPS

核心数:448,448

供应商:戴尔 EMC

地点:美国德克萨斯高级计算中心

Frontera 通过提供广泛的计算资源为工程和研究开辟了新的可能性,使科学家能够更轻松地应对广泛领域的许多复杂挑战。

Frontera 有两个计算子系统:第一个专注于双精度性能,第二个专注于单精度流内存计算。它还具有用于托管虚拟服务器的云接口和多个应用程序节点。

4.天河2A

广州国家超级计算机中心天河二号

速度:61.4 petaFLOPS

核心数:4,981,760

供应商: NUDT

地点:中国广州国家超级计算中心

天河 2A 拥有超过 16,000 个计算机节点,是全球最大的英特尔 Ivy Bridge 和至强融核处理器安装。虽然每个节点有 88 GB 的内存,但总内存(CPU + 协处理器)为 1,375 TB。

中国在建造这台超级计算机上花费了 24 亿元人民币(3.9 亿美元)。它现在主要用于模拟、分析和政府安全应用。

3.神威太湖之光

速度:93 petaFLOPS

核心数:10,649,600

供应商:NRCPC

地点:中国无锡国家超级计算中心

太湖之光的计算能力来自自主研发的多核SW26010 CPU,包括计算处理单元和管理处理单元。

由于其 260 个处理元件(集成到一个 CPU 中),单个 SW26010 可提供超过 3 teraFLOPS 的峰值性能。每个计算处理元件都有一个暂存内存,作为用户控制的缓存,显着减少了大多数应用程序中的内存瓶颈。

除了生命科学和药物研究,太湖之光还被用于模拟具有 10 万亿个数字粒子的宇宙。然而,中国正在努力实现更多目标:该国已经提出了到 2030 年成为人工智能领导者的目标。

2. 塞拉利昂

速度:94.6 petaFLOPS

核心数:1,572,480

供应商:IBM

地点:美国劳伦斯利弗莫尔国家实验室

Sierra 提供高达其前身 Sequoia 的 6 倍的持续性能和 7 倍的工作负载性能。它结合了两种处理器芯片:IBM 的 Power 9 处理器和 NVIDIA 的 Volta GPU。

Sierra 专为评估核武器系统的性能而设计。它用于库存管理、美国可靠性测试和核武器维护计划中的预测性应用,无需进行任何核试验。

1. 峰会

速度:148.6 petaFLOPS

核心数:2,414,592

供应商:IBM

地点:美国橡树岭国家实验室

Summit 在峰值时可以提供 200 petaFLOPS。这相当于每秒 200 千万亿次浮点运算。

它也是世界第三高能效超级计算机,记录的功率效率为每瓦 14.66 gigaFLOPS。

Summit 的 4,600 多台服务器占据了两个篮球场的大小,容纳了 9,200 多个 IBM Power9 处理器和 27,600 多个 NVIDIA Tesla V100 GPU。该系统通过 185 英里的光纤电缆连接,消耗的电量足以运行 8,100 个家庭

2018 年,Summit 成为第一台突破百亿亿级障碍的超级计算机。在分析基因组数据时,它实现了 1.88 exaops 的峰值吞吐量,接近每秒 20 亿次计算。

美国旨在开发一个功能齐全的百亿亿级计算生态系统,用于科学研究xt 年,Summit 是朝着这个目标迈出的一步。

1. 富乐

速度:442 petaFLOPS

核心数:7,630,848

供应商:富士通

地点:日本 RIKEN 计算科学中心

Fugaku 的理论峰值性能为 537 petaFLOPs,是世界上最快的超级计算机。它也是第一台由 ARM 处理器驱动的顶级超级计算机。

根据 HPCG 基准,Fugaku 的性能超过了世界排名前四的超级计算机的综合性能。

这对日本政府来说是一项了不起的成就,但设计如此强大的系统并不便宜。自 2014 年以来,政府已在该项目的研发、收购和应用开发上花费了约 10 亿美元。

Fugaku 并排运行在两个操作系统上:Linux 和称为 IHK/McKernel 的“轻量级多内核操作系统”。 Linux 处理可移植操作系统接口 (POSIX) 兼容服务,而 McKernel 运行高性能模拟。

它旨在解决高度优先的社会和科学问题,例如天气预报、清洁能源开发、药物发现、个性化医疗和探索量子力学定律。

经常问的问题

超级计算机运行什么软件?

几乎所有现代超级计算机都使用 Linux 操作系统。造成这种情况的主要原因是 Linux 的开源特性。

由于超级计算机是为特定目的而设计的,因此它们需要针对这些特定要求进行优化的自定义操作系统。事实证明,开发和维护封闭式、专有的操作系统是一个非常昂贵和耗时的过程。

另一方面,Linux 是免费、可靠且易于定制的。开发人员可以为每台超级计算机配置或制作单独的 Linux 版本。