另一个类似且重要的趋势是大数据端和云端上数据的移动及访问方式(图 2)。传统的计算机体系结构(图 2a)采用慢速外围总线,该总线连接到许多其他设备(例如,专用机器学习加速器、图形卡、高速固态硬盘、智能网络控制器,等等)。低速总线会影响设备的利用率,因为它限制了总线本身、主 CPU 以及主要的潜在持久内存之间的通信能力。这些新型计算设备也不可能在它们之间或与主 CPU 共享内存,从而导致在慢速总线上进行徒劳且受限制的数据移动。
关于如何改善不同计算设备(例如 CPU 和计算机及网络加速器)之间的数据移动,以及如何在内存或快速存储中访问数据,出现了几个重要的行业趋势。这些新趋势集中在开放标准化工作上,能够提供更快、更低延迟的串行结构以及更智能的逻辑协议,从而实现对共享内存的一致访问。
CPU 外围核心及网络接口控制器的作用将成为支持数据移动的关键因素。CPU 外围核心组件必须支持密钥内存和永久内存接口(例如 NVDIMM-P),也必须支持驻留在 CPU 附近的内存。还需要实施面向计算加速器、智能网络和远程持久内存的智能快速总线。这种总线上的任何设备(例如 CPU、通用或专用计算加速器、网络适配器、存储器或内存)都可以包含其自己的计算资源并具有访问共享内存的能力(图 2b 和图 2c)。
RISC-V 技术正是优化数据移动的关键推动因素,因为它能够在所有的计算加速器设备上针对新的机器学习工作负载来执行矢量指令。它实现了多种开源 CPU 技术,能够支持开放内存和智能总线接口;且实现了以数据为中心具有一致性共享内存的体系结构。