塞巴斯蒂安 发表于 2022-7-25 11:39:39

利用FPGA:让Optane持久内存可用于AMD、Arm平台

本帖最后由 塞巴斯蒂安 于 2022-7-25 11:39 编辑

2022年4月15日的昨天阅读国外网站的一条新闻,标题比较唬人《SMART brings Optane memory to AMD and Arm 》,其实就是下面这块卡:
利用FPGA:让Optane持久内存可用于AMD、Arm平台
Kestral™ FPGA Accelerator with Intel® Optane™ PMem DIMMs
SMART Modular这款Kestral PCIe Optane AIC,使用Intel Optane PMem(傲腾持久内存)DIMM和Intel FPGA来实现内存扩展和加速能力,号称TB级别PCIe连接内存,并能在DRAM和NAND闪存之间分层。

如果不是SMART网站上给出一个资料链接,我还真没印象曾经见过这块卡了。下图我在一年前的《CXL、GenZ、CCIX架构以及未来的PM、内存和SSD形态》一文中出示过:
利用FPGA:让Optane持久内存可用于AMD、Arm平台
就是画红圈这个卡哦。SMART Modular在SNIA组织的2021 Persistent Memory + Computational Storage Summit(持久内存&计算存储峰会)上有个演讲,可能当时该卡还在研发中,所以没有具体说支持Optane DIMM。

由于物理接口为PCIe,所以延时在<350ns的水平,转接后性能达不到直插主板DIMM插槽上也正常。

关键特性
利用FPGA:让Optane持久内存可用于AMD、Arm平台
- 尺寸:全高半长双宽;
- 接口:PCIe Gen4 x16(向下兼容Gen3);
- 内存:4个DIMM插槽,双通道。最多支持4条512GB Optane持久内存,或4条256GB DDR4 LR-DIMM,或者混合配置;
- 计算:4核ARM A53(FPGA集成),板载2GB DDR4内存、8GB存储(eMMC);
- 加速器:Intel Stratix 10 DX FPGA,可以现场升级新的算法、协议;
- 功耗:小于150W TDP(需要PCIe 6pin辅助供电)、被动散热

下面的小字体注释有时要重点看:当前版本的Kestral卡硬件支持基于DDR-T接口的Optane PMem,只有Memory Mode(内存模式)。也就是说不支持App Direct那样的3D XPoint持久化特性。

需要持久化的用户,目前还只能用Optane SSD块设备了。等将来CXL接口Optane持久内存出来的时候,SMART这个卡只是一个过渡吗?
内存扩展
利用FPGA:让Optane持久内存可用于AMD、Arm平台
由于FPGA充当了一个内存控制器的功能,所以SMART Kestral支持的平台与CPU无关,包括AMD、Arm甚至NVIDIA都可以。

虽然是PCIe x16 lane,但相比传统DIMM的64/72bit(含ECC)并行接口来看也算串行连接内存扩展吧,同时支持CCIX一致性接口来连接Optane。去年那篇我提到过一款基于Xilinx的Versal ACAP(号称FPGA之后的新一代计算平台)的PCIe板卡,也相当于通过CCIX连接的DDR4控制器(只用于内存,没有提到Optane)。

扩展阅读:
《AMD EPYC Genoa ‘7004’:若DDR5换OMI,CXL.mem服务器内存池化》
《OMI串行内存 (续):当POWER10遇上OCP-HPC & OAM》

至于FPGA的硬件加速,Kestral这里指的是线内压缩、加密、Key-Value存储。
利用FPGA:让Optane持久内存可用于AMD、Arm平台
从服务器主机CPU卸载特定的算法,移动计算到接近数据的位置

如上图,SMART Kestral可能只有Linux内核驱动。FPGA在一端配置出PCIe Ep,另一端则是并行I/O的DDR-T IP(估计Intel提供了支持)。

这里还提到具体的文本压缩算法:GZIP/ZLIB静态和动态Huffman编码。针对本地存储数据保护、Key-Value存储应该还有RAID、纠删码之类的支持。

问题:SMART Kestral 资料中所谓的“tiered between DRAM and NAND flash”,是与服务器上SSD之间的分层吧?

是否可以在该卡上跑一个RAID存储系统呢?

写到最后,我想起高人唐杰总之前发表过的2个观点:

1、Gen-Z、CCIX、OpenCAPI这些内存一致性互联连技术,除非联合起来才有可能与Intel较量。——今天的情况是,等CXL出来就快一统了吧?Gen-Z是已经投靠去拎鞋了…
2、Intel(的愿景)还是想让大家到CPU上来处理(SmartNIC/DPU这些)…——类比到本文的扩展内存产品形态,等CXL接口Optane PMem出来,不还是连到CPU集成的控制器吗?如有卸载需要最多再加一块FPGA或者QAT卡。

由于疫情原因,我这两年没去上海了,真的有些想念朋友们。一切都快点好起来吧!

参考信息
https://www.smartm.com/product/advanced-memory/AIC
https://blocksandfiles.com/2022/04/13/smart-brings-optane-memory-to-amd-and-arm/


页: [1]
查看完整版本: 利用FPGA:让Optane持久内存可用于AMD、Arm平台