您的位置:主页 > 公告动态 > 国王金融动态 > 国王金融动态
越来越热的CXL
二十年前,英特尔宣布了取代PCI总线的第三代I/O手艺(3GIO手艺),也就是我们现在常说的PCI-e(PCI Express)。依附高性能、高扩展性、高可靠性及精彩的兼容性,PCI-e险些取代了以往所有的内部总线(包罗AGP和PCI),成为那时众望所归的未来手艺尺度。
二十年后,在现在这个数据爆炸式增进,异构盘算大行其道的当下,曾经的“未来之星“PCI-e 已经最先泛起后继无力的征象,无法成为 CPU、GPU、FPGA 以及其他 AI 盘算装备之间相同的最佳语言。为了到达最佳的盘算效果,差其余盘算装备亟需“一种新语言”。
而这一次,英特尔推出的CXL手艺尺度似乎杀出了重围。
CXL是什么
CXL全称为Compute Express Link,是由英特尔于2019年3月在InterconnectDay 2019上推出的一种开放性互联协议,能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联,从而知足高性能异构盘算的要求。
图片泉源:英特尔
现在来看,CXL 支持三种协议,划分是,类似于 PCIe 的 CXL.io - CXL 使用 PCIe 总线的物理层,CXL.memory 用于主机内存接见,CXL.cache 用于一致的主机缓存接见。
此外,CXL 同盟也已经确定可从CXL中受益的三类主要装备:
类型 1(CXL.io 和CXL.cache):没有内陆内存的专用加速器(例如智能NIC),但可以行使 CXL.io 协媾和 CXL.cache 与主机处置器的 DDR 内存举行通讯。
类型 2(CXL.io、CXL.cache 和 CXL.mem):具有高性能GDDR或HBM内陆内存的通用加速器(GPU、ASIC或FPGA )。
类型 3(CXL.io 和 CXL.mem):内存扩展板和存储级内存。装备为主机 CPU 提供对内陆 DRAM 或非易失性存储的低延迟接见。
图片泉源:英特尔
最初,英特尔确立CXL尺度,是作为 CPU 与 GPU、FPGA等加速器之间的互联通讯,从而取代数据中央环境中的PCI-e。一直以来,CPU 都是透过主板上的 PCIe 插槽及 PCIe 协议与加速器相同,但显然其内存使用效率、延迟和数据吞吐量已经不能知足日益增进的数据和盘算速率需要。
相比PCIe,CXL尺度在接口规格上可兼容PCIe5.0,也就是说未来服务器 CPU 仍是置于主板 CPUSocket,GPU等加速器也是插在 PCIe 插槽上,但CPU 与 GPU 并非以 PCIe 协议举行相同,而是接纳新的 CXL 协议,可以明晰为PCIe 5.0 纯粹是用来提供实体插槽。
此外,CXL最高带宽可达128GB/s险些能够知足那时所有的数据传输需求,可以在更洪水平上允许更高的带宽,更多的毗邻装备和更低的延迟,解决现在 PCIe 协议存在的 CPU 与加速器之间高延迟、带宽不足等问题,而又不清扫PCIe的简朴性和顺应性。
正由于CXL构建与 PCI-e 逻辑和物理层级之上,以是其兼容性很高,更容易被现有支持 PCI-e 端口的处置器(绝大部门的通用 CPU、GPU 和 FPGA)所接纳,因此,英特尔将CXL视为在PCIe物理层之上运行的一种可选协议,也就是说PCI-e 的互联协议没有被完全甩掉,而且英特尔还设计在第六代 PCI-e 尺度上鼎力推进 CXL 的接纳。
除了兼容性很高之外,CXL尺度尚有另一个较大优势就是内存一致性。
从本质上讲,CXL可在CPU,以及GPU、FPGA等之间确立高速且低延迟的互连,维护 CPU 内存空间和毗邻装备上的内存之间的内存一致性,允许 CPU 与 GPU 之间绕过 PCIe协议,用 CXL 协议来共享、互取对方的内存资源。透过 CXL协议, CPU 与 GPU 之间形同连成单一个重大的客栈内存池,CPU Cache 和 GPU HBM2 内存犹如放在一起,有用降低两者之间的延迟,故此能大幅提升数据运算效率。
除了资源共享(内存池)和交流之外,CXL 还可以通过毗邻 CXL 的装备向CPU 主机处置器添加更多内存。当与持久内存配对时,低延迟 CXL 链路允许 CPU 主机将此分外内存与 DRAM 内存连系使用。
由于大内存容量决议了大容量事情负载的性能,从这方面看,CXL 的优势显而易见。
CXL与Gen-Z之战
就像开头所提到的,差其余盘算装备亟需“一种新语言”,那么自然不会只有一个CXL泛起,事实上,CXL可以说是最晚泛起的一个尺度,在它之前,尚有IBM 的 CAPI 和 OpenCAPI、英伟达的 NVLink 和 NVSwitch、AMD的 Infinity Fabric、赛灵思的CCIX ,以及在这部门要说到的Gen-Z。
Gen-Z可以看成是CXL的先行者,源于 HPE 开发的 The Machine,是一种以内存为中央的新型盘算机架构。Gen-Z 同盟确立于 2016 年,由HPE 和戴尔提供支持。详细来说,Gen-Z协议允许分配和释放资源,无论是内存、加速器照样网络,可用于确立该资源与一个或多个 CPU 节点的暂且或永远绑定。本质上,这个想法是把任何类型的存储都作为内存看待,允许软件使用低延迟,高效率操作来接见。
使用 Gen-Z 和 CXL 举行剖析。资料泉源:IntelliProp
在已往,Gen-Z和CXL都属于数据中央、HPC、AI等领域全新数据装备互联协议的向导者,支解着数据中央的互连和内部毗邻,但厥后却“节节败退”。先是在2020年4月,Gen-Z同盟与CXL同盟杀青相助备忘录,强调了两者之间的相助共赢,CXL专注于机架内CPU、GPU和加速器之间的互联,而Gen-Z卖力支持机架之间的互联。在和平休战一年多后,2021年11月,Gen-Z同盟与CXL同盟正式公布通告,把所有Gen-Z规范和资产转移给CXL同盟,双方同盟成员将专注于CXL这唯一的互联尺度。至此,CXL也确立了自己的领先职位,将成为未来唯一的行业尺度。
在这场互联尺度争取战中,CXL凭什么可以“吞并”Gen-Z?
这就不得不说到两大同盟的介入者,Gen-Z同盟的介入者包罗了AMD、Arm、惠普企业(HPE)、IBM、美光、三星、SK海力士、希捷、西部数据等20个厂商,虽然都是大厂,然则最主要的服务器 CPU 供应商却只有IBM。而CXL同盟那里不仅群集了内存厂商、IP厂商、加速器厂商等,更主要的是,它有AMD、ARM 、IBM 以及英特尔所有四个主要的 CPU 供应商的加入。任何用于处置器与 DRAM、FPGA以及其他专用处置器互连的后 PCIe 总线手艺都必须获得服务器 CPU 供应商的支持,这是一个需要条件。光从这点,Gen-Z同盟就注定难以与CXL同盟抗衡。
而另一方面,CXL较晚的推出时间反而成为了它的“利器”。随着PCI-Express 脱节了 3.0 和 4.0 代之间七年的阻滞状态,并进入两年带宽翻倍的性能节奏,这给基于PCI-Express 协议的CXL带来了更大的优势。相比CXL,Gen-Z等其他协议充其量只能降级为 CPU 到 CPU 互连,而CXL 作为兼容的 CPU 一致性协议,将允许跨 CPU 架构的尺度,可以说CXL 在 PCI-Express 5.0 上的性能就是为此而存在的。
紧锣密鼓的结构
自从去年乐成“吞并”Gen-Z后,CXL的崛起势头可以说是越发强劲,Marvell、三星、Rambus、澜起科技等大厂们的结构速率日渐加速,尤其在进入5月份后,“落子”速率变得加倍麋集。
·完善电子收购 CXL 开发商 Tanzanite
完善电子正在举行以数据中央为重点的投资(包罗其 CXL 解决方案)来扩大潜在市场,5 月 9 日,完善电子宣布将收购先进 CXL手艺领先开发商Tanzanite,加速实现完全可组合的云基础架构的愿景。
Marvell存储营业事业部执行副总裁Dan Christman示意:“我们信托 CXL 将成为实现下一代数据中央最佳资源行使的重大转变者,而收购 Tanzanite 将提高我们解决客户最具挑战性问题的能力。“
据领会,未来的云数据中央将确立在行使 CXL 手艺的完全剖析式架构上,基于毗邻处置器、加速器和内存的行业尺度 CXL 的硅组件将促进具有显着性能和效率优势的新云数据中央架构。
·Rambus收购哈登,增强CXL互连设计
5月5日,行业领先芯片和硅 IP 提供商Rambus宣布已签署收购Hardent, Inc. 的协议,该生意预计将于 2022 年第二季度完成。
Rambus官方新闻显示,Hardent 拥有 20 年的半导体履历,其天下一流的硅设计、验证、压缩和纠错码 (ECC) 专业知识为 Rambus CXL 内存互连设计提供了要害资源,此次收购加速了下一代数据中央的CXL 处明晰决方案的开发。
Rambus总裁兼首席执行官Luc Seraphin 示意:“在 AI/ML 等高级事情负载的需求以及向分类数据中央架构的转变的推动下,基于 CXL 的解决方案的行业势头继续增进。”
·澜起科技公布全球首款CXL内存扩展控制器芯片
5月6日,澜起科技公布全球首款CXL内存扩展控制器芯片(MXC)。
图片泉源:澜起科技
据领会,这款MXC芯片是一款CXL DRAM内存控制器,属于CXL协议所界说的第三种装备类型,根据 CXL 2.0 规范设计,支持 PCIe 5.0 规范速率,专为内存AIC扩展卡、背板及EDSFF内存模组而设计,可大幅扩展内存容量和带宽,知足高性能盘算、人工智能等数据麋集型应用日益增进的需求。
·三星推出 512GB CXL 内存扩展器 2.0
5月10日,三星宣布开发出三星首款512 GB内存扩展器 CXL DRAM,接纳ASIC 的CXL控制器,并首次封装了内存容量为512GB的 DDR5 DRAM,与之前的三星CXL产物相比,内存容量为其4倍,系统延迟仅为其五分之一。
三星半导体512GB内存扩展器 CXL DRAM
值得一提的是,三星这次推出的这款内存模组CXL内存扩展控制器芯片正是由上述提到的澜起科技提供。
写在最后
每当一个新名词的泛起,就意味着即将泛起一个新市场。虽然CXL仅用两年时间就走完了其他尺度远程跋涉的路,成为本次互联尺度争取战的获胜者,但其市场还未成熟,这或许又是新的生长时机。从上述提到的大厂结构,我们可以看出,大陆选手在CXL领域并未落伍,甚至争先获得一分,想必未来只会加倍精彩。
正如夏晶晶先生在知乎上曾示意的,CXL是intel对盘算产业的一次伟大让利,做好CXL很有可能短期在中国海内获得怪异的性能优势。
上一篇:字节吃不饱,新茶饮来凑?