NextSilicon Maverick-2:数据流芯片能否革新高性能计算?RISC-V核心Arbel初探

NextSilicon Maverick-2:数据流芯片能否革新高性能计算?RISC-V核心Arbel初探

NextSilicon,这家总部位于以色列的初创公司,凭借其创新的Maverick-2加速器,正试图颠覆传统的处理器行业格局。这款基于数据流计算架构的芯片,能否解决困扰业界巨头多年的难题,成为高性能计算和数据中心工作负载的有力竞争者?本文将深入探讨Maverick-2的技术细节、性能表现,以及其RISC-V核心的潜力,并分析其面临的挑战与市场前景。

数据流计算:新架构的优势与挑战

传统冯·诺依曼架构的处理器,如CPU和GPU,在处理指令、管理分支预测和处理缓存一致性等方面消耗了大量硅片面积和功耗。Maverick-2的核心在于其数据流执行结构。与传统架构不同,Maverick-2的算术逻辑网格在输入数据可用时即被激活,而非依赖程序计数器逐步执行指令。这种设计理念允许硬件将更多硅片面积用于计算资源,理论上能实现更高的硅资源利用率和功耗效率。NextSilicon声称,Maverick-2在性能上可比肩甚至超越顶级GPU,同时功耗降低多达60%,并且能够运行未修改的C++、Python、Fortran等代码,甚至包括英伟达CUDA代码。

Maverick-2 的技术细节与性能表现

Maverick-2的软件层会实时分析代码,识别计算热点,并动态重新配置计算资源,有效地将静态芯片转变为自优化引擎。它自动构建并编译称为“MillCores”的专门硬件配置,并将其作为即用型镜像保存在芯片内存中。当应用程序的性能关键部分出现时,硬件会使用这些预构建的镜像在纳秒内瞬间重新配置自己。这种动态适应性对于从高性能计算模拟到数据分析、AI训练和AI推理等工作负载来说,具有颠覆性潜力。Maverick-2还提供单个或双100千兆以太网连接以实现可扩展性。在实际测试中,Maverick-2在GUPS工作负载中比CPU快22倍,比GPU快近6倍;在高性能共轭梯度基准测试中,性能与顶级GPU相当,但功耗约为一半。在PageRank测试中,它完成了领先GPU无法完成的大型图形处理任务。这些数据虽然来自内部测试,但桑迪亚国家实验室的验证也表明了其潜力。

RISC-V核心Arbel:控制与计算的融合

NextSilicon还推出了新的RISC-V核心CPU核心,被称为Arbel。该核心诞生于Maverick-2架构的一个组成部分,用于处理串行逻辑和编排,以保持芯片的大规模数据流网格高效运行。Arbel处理器为了能够独立运行甚至主机CPU应用程序而进行了一些扩展,NextSilicon声称其RISC-V核心测试芯片可能是市场上性能最高的RISC-V CPU核心设计。高速标量控制与自适应数据流计算的紧密集成,是Maverick-2区别于传统加速器的关键。NextSilicon将Arbel定位为与Maverick-2/3加速器产品紧耦合,服务超算中心与科学计算等数据中心负载,挑战x86架构+GPU体系的主流范式。

尽管Maverick-2展现出巨大的潜力,但其成功并非仅取决于原始性能。半导体市场更看重生态系统的成熟度。英伟达在AI领域的成功,不仅仅是芯片本身,更是围绕着CUDA等编程库、开发者熟悉度、完整机架级解决方案和多年优化所构建的完整平台。NextSilicon需要克服生态系统的挑战,确保其技术能够真正集成到现有的高性能计算和AI框架中。此外,制造规模、供应链以及与台积电等代工厂的合作,也将是影响其市场表现的重要因素。如果Maverick-2能够提供其声称的性能功耗比优势,它可能会在高性能计算、仿真和AI驱动的科学研究中开辟一个利基市场。随着数据中心对能效要求的不断提高,Maverick-2这类数据流芯片或许会成为未来计算架构的一个重要发展方向。你认为数据流架构能否真正改变高性能计算的格局?欢迎在评论区分享你的看法。

返回搜狐,查看更多

相关文章