公众号记得加星标⭐️,第一时间看推送不会错过。


去年底,桑迪亚国家实验室开始测试一种非同寻常的超级计算机。与由大型互连的CPU和GPU集群组成的传统超级计算机不同,这台机器集成了可重构加速器,能够针对特定计算任务优化自身运行。这种类似于现场可编程门阵列(FPGA)的新架构由初创公司NexSilicon开发。该方法的一个关键优势在于无需重写软件:硬件会针对软件进行自我优化,而不是反过来。

Spectra 系统集成了 128 个NextSilicon Maverick-2 加速器,目前仍处于研究阶段,项目负责人兼桑迪亚国家实验室高级科学家James Laros表示。NextSilicon 的总部位于特拉维夫和明尼阿波利斯,该公司声称其加速器通常功耗只有 NVIDIA Blackwell 的一半,速度却快 4 倍。功耗和速度会根据具体应用而有所不同。

灵活性的力量

NextSilicon 首席执行官 Elad Raz 表示,传统架构会预测下一条指令,然后获取并缓存数据。“如果能消除所有这些开销呢?”他疑惑道。“很多人都在尝试开发新的 CPU 或更强大的 GPU。其他公司则提供软件解决方案,”Raz 说,“而我想要打造的是软硬件协同运作的产品。”

该公司开发的 Maverick-2 首先在 CPU 上运行应用程序,并识别出哪些操作运行频率最高。然后,它重新配置芯片,以优化数据流的方式安排其工作。他表示,这样就无需来回获取数据,“你可以生成一条数据管道”。

该公司设计的一大优势在于,用户无需重写软件即可使其在系统上更高效地运行。硬件会适应软件,而不是反过来。

拉罗斯说,桑迪亚国家实验室运行的大多数应用程序都受到内存带宽的限制。“如果我们不必返回主内存,速度就能更快,那会怎样?”这就是Spectra架构的潜力所在。

Raz表示,Maverick的功耗只有NVIDIA Blackwell的一半,运行HPCG(一种超级计算基准测试)的速度是其两倍;运行PageRank(另一种基准测试)的速度更是其十倍。桑迪亚国家实验室的科学家们目前正在评估Spectra在运行分子动力学模拟(预测原子运动,广泛应用于物理学和材料科学领域)以及美国能源部使用的其他核心代码时的性能。“它的优势在于,如果能让那些在GPU上运行不佳的应用程序获得更好的性能,或者在保持相同性能的同时提高能效,”Laros说道。

通过实验支持任务

桑迪亚国家实验室利用计算机模拟来维护美国的核武库。“我们已经用模拟和计算取代了测试,”拉罗斯说。由于这项任务至关重要,实验室必须“确保我们不会把所有鸡蛋放在一个篮子里,”他说道。如果一家为美国政府提供核武库管理技术的公司倒闭,政府就需要有替代方案。“我们维护着一系列相互关联的技术,”拉罗斯说。

Spectra是桑迪亚国家实验室先锋计划的一部分,该计划允许政府与初创公司合作,测试并帮助开发早期高性能计算技术。“我们的目标是测试这些技术在我们先进的模拟和计算任务代码中的应用,”拉罗斯说。

拉罗斯表示,桑迪亚国家实验室的大部分代码运行在CPU上。他们也采用了英伟达公司开发的基于GPU的系统。这些系统速度更快,但需要实验室人员移植代码。“这花了我们数百个小时,”拉罗斯说。此外,还有一些重要的科学模拟程序在GPU上运行不佳,例如可用于评估复杂风险的蒙特卡罗方法。

拉罗斯表示,目前专注于高性能科学计算的计算初创公司并不多见——他说,如今“一切都围绕着人工智能”。Next Silicon 正在开发一种硬件,该公司希望凭借其承诺的节能特性,该硬件能够为人工智能和计算机带来优势。电力供应是目前大型人工智能数据中心面临的主要制约因素。拉兹希望 NextSilicon 的加速器能够通过在给定的电力消耗下实现更高的性能效率来提供优势。

“先锋计划”允许政府测试高风险技术的潜力。“失败在所难免,”拉罗斯说。“我们的目标是进行非常先进的技术探索。我们验证其可行性。其他实验室和其他商业机构将会效仿。”

https://spectrum.ieee.org/reconfigurable-supercomputer

(来源:编译自IEEE)

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4331期内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐