好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

基于CXL的内存分解技术为大数据解决方案框架开辟了新方向

来自 KAIST 的计算机架构和内存系统实验室 (CAMEL) 的一个团队提出了一种新的计算快速链接 (CXL) 解决方案,其可直接访问的高性能内存分解为大数据内存处理开辟了新的方向。与现有的基于远程直接内存访问 (RDMA) 的内存分解相比,该团队的技术显着提高了性能。

CXL 是一种基于外围组件互连快速 (PCIe) 的新型动态多协议,旨在有效利用存储设备和加速器。作为大数据时代的下一代多协议,许多企业数据中心和内存厂商都在关注它。  

新兴的大数据应用程序(例如机器学习、图形分析和内存数据库)需要大内存容量。然而,通过双倍数据速率 (DDR) 等现有内存接口扩展内存容量受到中央处理单元 (CPU) 和内存控制器数量的限制。因此,出现了允许将主机连接到另一个主机的内存或内存节点的内存分解。

RDMA 是一种主机可以通过 InfiniBand 直接访问另一台主机内存的方式,InfiniBand 是数据中心常用的网络协议。如今,大多数现有的内存分解技术都采用 RDMA 来获得大的内存容量。因此,主机可以通过在本地和远程内存之间传输数据来共享另一台主机的内存。 

尽管基于 RDMA 的内存分解为主机提供了很大的内存容量,但存在两个关键问题。首先,横向扩展内存仍然需要添加额外的 CPU。由于动态随机存取存储器(DRAM)等无源存储器不能自行运行,因此应由 CPU 控制。其次,基于 RDMA 的内存分解的冗余数据副本和软件结构干预会导致更长的访问延迟。例如,基于 RDMA 的内存分解中的远程内存访问延迟比本地内存访问长多个数量级。

为了解决这些问题,研究团队开发了基于 CXL 的内存分解框架,包括支持 CXL 的定制 CPU、CXL 设备、CXL 交换机和 CXL 感知操作系统模块。该团队的 CXL 设备是一个纯无源且可直接访问的内存节点,其中包含多个 DRAM 双列直插内存模块 (DIMM) 和一个 CXL 内存控制器。由于 CXL 内存控制器支持 CXL 设备中的内存,主机可以在没有处理器或软件干预的情况下使用内存节点。该团队的 CXL 交换机通过将多个 CXL 设备分层连接到允许数百个设备的 CXL 交换机来扩展主机的内存容量。在交换机和设备之上,该团队支持 CXL 的操作系统消除了传统 RDMA 所表现出的冗余数据复制和协议转换。

在比较从内存池设备加载 64B(缓存线)数据的测试中,基于 CXL 的内存分解显示出比基于 RDMA 的内存分解高 8.2 倍的数据加载性能,甚至与本地 DRAM 内存的性能相似。在团队对基于机器学习的测试等大数据基准的评估中,基于 CXL 的内存分解技术也显示出比之前基于 RDMA 的内存分解技术最高 3.7 倍的性能。

基于 CXL 的内存分解框架可以为各种数据中心和云服务基础设施提供高可扩展性和性能,基于 CXL 的内存分解研究将为内存解决方案带来新的范式,从而引领大数据时代。获 取 更多前沿科技 研究 进展访问:https://byteclicks.com

上一篇:

下一篇:


标签