您的位置:主页 > 公告动态 > 国王金融动态 > 国王金融动态

AI时代的存力腾飞-香港期货开户

在数字经济大潮下,数据已经成为新型的生产资料。

现在数据中央有三大气力:盘算的气力——算力、存储的气力——存力、运输的气力——运力,即网络的气力。

算力产业链正在火热生长的同时,存力的需求也大幅度提升。2023年上半年,我国存力规模增进了23%,到达了1080EB。

为何存力越来越受到重视?由于岂论大模子演进照样算力中央生长,都离不开海量的数据基础,和数据息息相关的存储。

中国工程院院士倪光南曾指出:“各地都在建AI算力中央,往往人人体贴的就是每秒若干次的运算,这是算力,这显然很主要。然则AI盘算从科学的角度来看应该用广义的算力来示意,存力、算力和运力三者合起来组成广义算力。”

01

存力的界说

随着智能天下的到来,数据量正在以惊人的速率增进,预计到2030年,全球数据将进入YB时代。

有数据的地方就需要数据存储,若何将数据举行妥善、平安地存储,就显得尤为主要,有赖于数据存储的综合能力,即数据存力。

盘算存储能力的容量,接纳单元GDP存储容量来确保差异国家的可比性,即用数据存储空间容量除以GDP规模。每一万美元GDP对应的存力容量越高,解释该国的数据存力容量水平越高,该国数字经济在GDP中的渗透水平越高,能更好支持经济社会高质量生长。

测算效果显示,新加坡、捷克、美国等蓬勃国家的单元GDP存储容量较高,每一万美元的GDP对应的存储容量划分达46.7GB、33.4GB、33.3GB,存储在经济生长中的支持能力较为显著。南非、俄罗斯、中国等经济体量较大的生长中国家处于中央水平,每一万美元GDP对应的存储容量在23GB和31GB之间。

通过盘算一国数据存储容量除以一国数据总产量可以反映昔时一个国家或区域所生产的所有数据中,有多大占比可以被存储,以反映存力的足够性可以权衡一个国家的数据存力是否足够足够以支持其经济社会高质量的生长需求。

全球局限内,每万亿美元GDP汇聚的数据量均保持14.5%的快速增进态势,北美的美国、加拿大等蓬勃国家更是到达16.8%,反映出数据量增进的迅猛之势。

存力投资增进率指标使用2017年-2019年三年间各国的存储投资的年复合增进率来权衡各国增进动能。高增进率体现的是在各国已有的数据存储规模之上数据存储的生长速率和潜力。

沙特、中国、俄罗斯等生长中国家的存储市场增进迅速2017-2019年复合存力投资增进率均跨越40%。

存力作为算力的主要组成部门,随着大模子对算力需求的发作式增进,行业对存储能力提出了更高的需求,先进存力也成为了算力高质量生长的主要生长偏向。

02

AI时代,存力若何演进?

AI时代对于存储提出了更多的要求:

高速数据处置:尤其是深度学习模子,AI需要快速处置和剖析重大数据集,这要求存储系统必须具备高效的数据读写能力。

大容量存储:随着数据量的剧增,存储系统需要更大的空间来容纳训练数据、模子参数及推理效果。

低延迟接见:实时AI应用对存储系统的响应速率要求极高,低延迟的存储解决方案能显著提高处置速率和应用响应时间。

可扩展性:存储系统必须能够随着AI应用的扩展而天真增进,顺应日益增进的存储需求。

根据调取速率的快慢和成本的崎岖,AI时代需要的内存和存储器可以分为四种。

最末的层级,处于金字塔的低端,对应的是速率较慢的、成本较低的SSD存储产物。

SSD属于数据存储的底座,相较于DRAM解决的主要是盘算时数据传输的问题,巨量数据保留照样依赖NAND Flash制成的SSD、嵌入式存储。

“SSD(固态硬盘)将成为AI的一部门。” 花旗剖析师Peter Lee日前宣布讲述,提醒投资者注重即将到来的“替换周期”,SSD可能会取代硬盘驱动器用于AI。他指出,SSD“更适合AI训练应用”,由于其速率较HDD快40倍。

SSD的演进主要通过两方面:一方面是容量,另一方面是性能和功耗。

一方面,AI时代对于高容量的SSD需求正在快速上升。需要SSD不仅有更大的存储容量,还要能够在不牺牲性能的条件下,通过手艺的改善等提高NAND密度。

随着 TLC 闪存架构最先到达原始存储容量的极限(就像之前的 SLC 和 MLC 一样),QLC 代表了希望不停突破主流消费 SSD 容量极限的 SSD 制造商的未来。现在,存储厂商都已经宣布QLC闪存。

三星宣布的新一代 QLC NAND 闪存,其面积密度极高,到达每平方毫米 28.5 Gbit。SK海力士的子公司,Solidigm推出了接纳QLC闪存的61.44 TB D5-P5336 SSD产物。

从最新的需求来看,TrendForce集邦咨询示意,第二季AI服务器对大容量SSD的需求连续看涨,除了推升第二季Enterprise SSD合约价钱续涨跨越两成,预估第二季Enterprise SSD营收获长幅度仍有时机续增20%,QLC大容量产物的需求动能显著优于其他容量。

另一方面,在性能和功耗方面,随着数据中央对于存储装备速率要求的不停提升,SSD需要提供更高的IOPS(每秒输入输出操作次数)和带宽(GBPS),同时在保证高性能的同时必须有用控制功率消耗,实现单元性能所需的能耗降低。

年赚500亿!论斤卖的东北土特产,暴打网红刺客

协议接口和NAND接口速率是*助力点。现在,为了追求高性能,NVMe/PCIe SSD是数据中央的高性能标配。

PCIe5.0的规范早在5年前就已经宣布,不外散热、信号消耗等问题一直是阻止PCIe5.0 SSD在PC市场推广的主要缘故原由。不外,随着手艺的普及,PCIe5.0的市场份额将不停扩大。三星半导体也预计,PCIe5.0很快会应用于PC端的SSD产物。

此外,现在PCIe 6.0已经宣布,将把数据传输速率从PCIe 5.0的32 GT/s和PCIe 4.0的16 GT/s提高到每引脚64 GT/s,PCIe 6.0 ×16通道单向理论数据传输速率到达了128 GB/s(双向256 GB/s)。

第三层级,则是可以以更高性价比给大模子提供跟大容量的CXL的内存扩展方案。

需要注重的是,PCLe是可扩展且有条理的,带有嵌入式交流机或交流机芯片,支持一个根端口与多个终端毗邻,例如多个存储装备(以及以太网卡和显示驱动程序等其他终端)。然而,这种实现方式在一种带有伶仃内存池的大型系统中存在局限,这种系统中的处置器和加速器在统一个 64 位地址空间内共享相同的数据和内存空间举行异构盘算。

与使用 CXL 的替换实现方案相比,缺乏缓存一致性机制会导致这些应用的内存性能低下,延迟不能接受。

因此,虽然 64GT/s 的 PCIe 6.0.1 的引入有助于增添存储应用程序的可用带宽,而延迟增添很少或没有增添,但一致性的缺乏仍然限制了 PCIe 应用程序,如传统的 SSD 这种块存储装备。对于这些存储应用,使用 PCIe 作为传输接口的 NVMe 已经占有了 SSD 手艺的主导职位。正在开发中的下一代 SSD,它们将使用 CXL 接口替换 PCIe。

从产物来看,三星有两款CXL存储模组用在数据存储方面。一款是已经推出的*代基于SoC的CXL2.0产物CMM-D,三星半导体设计在2025年宣布搭载第二代控制器、容量为128GB的新产物。与此同时,三星还在不停研发同时使用NAND和DRAM的夹杂式CXL存储模组架构CMM-H,该架构针对AI和ML系统使用。

美光推出了CZ120 CXL内存扩展方案,最多可以扩展2TB内存容量。此外,添加可扩展内存后,Llama2 LLM的推理性能提升了22%,可以更洪水平释放GPU性能。

第二层级,是速率更快,价钱也更高的DDR内存。

DDR、LPDDR、GDDR是基于DRAM的三种内存规范或尺度。DDR因其性能和成本优势成为现在PC和服务器端主流内存。

2020年,为解决从客户端系统到高性能服务器的普遍应用所面临的性能和功耗挑战,JEDEC(固态手艺协会)正式宣布了下一代主流内存尺度DDR5 SDRAM的最终规范(JESD79-5)。

JEDEC将DDR5形貌为一种“具备革命意义”的内存架构。

与DDR4相比,DDR5具备更高速率、更大容量和更低能耗等特点。DDR5内存的最高传输速率达6.4Gbps,比DDR4凌驾一倍。现在,无论是 PC、条记本电脑照样人工智能,各行业正在加速向 DDR5 新纪元迈进。

2024年年头DDR5求过于供,缺口达3%。据市场新闻人士展望,得益于天生式人工智能(GenAI)的需求,DDR5在内存市场的渗透率将加速增添,预计将在2024年下半年到达两位数百分比。

现在在AI服务器中的另一个趋势则是DDR转向GDDR。

DDR存储器的设计延迟极低,它的目的是尽可能快地传输少量缓存数据,来配合CPU举行串行盘算。而显卡多为并行义务,有大量重复存取需求,但它对于延时的要求没有CPU那么高。于是,具有更大带宽和更高频率的GDDR泛起了。

今天GDDR的尺度更新到了第七代,也就是GDDR7。美光已经宣布了将用于显示卡的新一代GDDR7显示存储器最先送样测试,相比前一代GDDR6显示存储器将可提升60%资料传输频宽,同时也新增睡眠模式,将使待性能耗降低70%。

*个层级处于金字塔顶端,对应事情速率异常快,然则成本异常昂贵的内存,好比HBM。作为内存芯片,它可以将大量数据快速喂养给GPU。

HBM是高带宽存储器,是基于3D客栈工艺的高性能DRAM,实在就是将许多个DDR芯片堆叠在一起后和GPU封装在一起,实现大容量,高位宽的DDR组合阵列。

HBM 解决了传统 GDDR 遇到的“内存墙”问题,接纳了近存盘算架构,不通过外部连线的方式与 GPU/CPU/Soc 毗邻,而是通过中央介质层紧凑快速地毗邻信号处置器芯片,极大的节约了数据传输所使用的时间与耗能。

HBM的手艺方面已经生长至第五代。划分是:HBM(*代)、HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)、HBM3E(第五代)。对于规格更高的HBM4,可能在2026年推出。

HBM的市场方面,在2023年的全球HBM市场,SK海力士市占率有望提升至53%,三星市占率为38%、美光市占率约为9%。不外,5日美光宣布预计2024会计年度将抢下HBM市场跨越20%的份额。AMD 和 NVIDIA 两家尖端的 GPU都陆续配备了 HBM。

03

存储的下一站:存算一体

到这里,我们已经能看到存力不停演进的历程。

从一最先的数据存储SSD,再到数据盘算DDR5,再到进一步解决数据传输问题的HBM,存储一直在解决数据存取的效率问题。因此,存储的下一步,要害照样在打破“存储墙”。

存算一体的优势正是解决传统冯·诺依曼架构下的“存储墙”和“功耗墙”问题。消除不需要的数据搬移延迟和功耗,并使用存储单元提升算力,成百上千倍的提高盘算效率,降低成本。

AMD、特斯拉、三星、阿里巴巴等公司都曾在公然场所示意,下一代手艺的贮备和演进的偏向是在“存算一体”手艺架构中寻找新的生长动能。

例如,阿里达摩院就曾示意,相比传统CPU盘算系统,存算一体芯片的性能可以提升10倍以上,能效提升跨越300倍。

现在,存算一体的手艺路径大致分为近存盘算(PNM)、存内处置(PIM)、存内盘算(CIM)。国际巨头好比英特尔、IBM、特斯拉、三星、阿里等,探索磁性存储器(MRAM)、忆阻器(RRAM)等产物相继量产;海内方面知存科技、亿铸科技、九天睿芯等初创公司都在押注PIM、CIM等“存”与“算”更亲密的存算一体手艺蹊径。