找回密码
 加入我们
搜索
      
查看: 1391|回复: 26

[电脑] 5.0时代的终极选择,PBlaze7 7940 32TB SSD评测

[复制链接]
发表于 2024-12-18 14:20 | 显示全部楼层 |阅读模式
至今还记得当初拿到忆恒创源(Memblaze,小海豚)PBlaze6 6930 30.72TB时的激动心情。在它面前,所有M.2都变得不值一提,甚至企业级16T也不香了。此时容量已超越一切,大,就行了!(当然,6930也确实交出了一份出色的答卷,我也在此前的帖子里进行了详细的测试,看这里

image001.jpg

今天有幸率先体验到它的迭代产品,PBlaze7 7940 30.72TB,不仅升级PCIe 5.0,性能继续大幅提升,同时,它仍然坚持使用TLC NAND,相较于QLC,TLC的写性能和写寿命都要更好,加上针对1U服务器打造的E1.S 15.36TB版本,对于同时需要大容量、高性能的业务场景来说,会是更好的选择。

image003.jpg

32T,有必要吗?

有没有必要,我不知道,但想要,是真的想要。

随着AI等应用的崛起,市场对于高性能、大容量SSD的需求正在增加。一边是有限的机柜、服务器数量与能源供给,另一边是无限的算力需求以及庞大的数据规模——少部署几片NVMe,便能多部署一颗GPU,这也是大容量QLC能够赢得市场的核心原因。

和国外相比,国内情况有所不同,往往是大公司掌握着最好的技术,也都具备自己的大规模数据中心,机柜数量相对充足,对容量的敏感性要低一些。

但不可否认,更高的性能、更大的容量,可以有效减少存储服务器的部署数量,保障现有业务的使用需求,为未来新业务开展留足空间,特别是一些数据中心面临硬件升级,选择PCIe 5.0,实现更高的算力、存力密度,一步到位。

2>1+1 的故事

存储是特别典型的,可以通过堆砌硬件规格,获得更高容量与性能的产品。30.72TB带来的不仅仅是容量翻倍,同时也伴随单位成本的增加,这里不光有HDP(High Density Package)的因素,也有DRAM的因素。如何在过多的Die配置下,让NAND、DDR颗粒都能达到需要的工作频率,成为考验SSD厂商的首要难题。

同时,传统4K映射也让这款SSD的DRAM达到了恐怖的32GB!加上ECC校验,实际物理容量高达40GB!而作为对比,目前大容量QLC SSD普遍使用16K映射,32TB容量只需要8GB DRAM即可,并大幅节约成本。

因此,你甚至可以在这块SSD上看到一些冗余的硬件设计,据悉,这也是权衡了所有性能因素,所作出的最优配置。我不是研发人员,所以不抬杠。当然,如果做64TB,也不是不可,改为双板再加IO Buffer即可,15mm厚度U.2的空间是完全允许的。

image005.jpg

PBlaze7 7940 简介

PBlaze7 7940系列发布于2023年8月,2023年12月量产,至今已有1年的时间。它是全球首款写性能超过10GB/s的企业级SSD,有着超过PM1743、CM7的领先性能和更低的功耗,并提供多种产品形态。截至12月,PBlaze7 7940的实际出货规模已经超过20万片。

随着全国产“新王”PBlaze7 7A40的发布,小海豚正逐渐形成 7940主要面向国际市场,7A40主要面向国内市场的双线产品布局。这款 7940 30.72TB的问世,将同时带给两个市场远超过QLC SSD的更优选择,以更高的存力密度,为企业带来业务改善,并大幅降低部署与运营成本。

外观一带而过,和7.68TB版本相同,盘片大面积的鳍片开槽,可极大增加SSD与空气的接触面积,两端开孔也可进一步提高SSD的散热效率,在密集部署下减少服务器进风阻碍,属于非常成熟且优秀的设计。内部焕然一新,主要变化为NAND距离主控更近,以缩短布线长度,保证信号质量;DRAM增加到10颗,以满足映射表的存放需求,并保证DRAM的性能。

image007.jpg

SSD使用默认的512B Sector Size格式化,本次测试依旧在我的台式机上进行,使用 U.2 - PCIe 的转接卡,安装在主板第一根PCIe 5.0 x16插槽,图形核心使用CPU集成显卡。需要指出,由于CPU有点老,部分测试成绩比小海豚官方数据低一些,这颗i5-12600K表示尽力了。

  • CPU:Intel Core i5-12600K
  • Motherboard:ASUS ROG Z690 HERO
  • Memory:DDR5 4800 16GB ×2
  • System Drive:SATA SSD
  • System:Fedora 40 Linux 6.11.10


image009.jpg

基准性能测试

此环节在Linux系统下,通过大名鼎鼎的Fio测试软件进行。该软件也是很多企业级SSD厂商制定SSD性能指标的重要依据。

4K随机性能测试开始前,需要对SSD进行最少一遍的128K顺序全盘填充,然后进行至少两遍的4K随机填盘,以便让SSD进入稳态。由于本次的测试盘容量实在太大,4K随机填盘时间被设定为5万秒,QD为512。

稳态:指的是由于NAND先擦后写的特性,导致SSD在使用一段时间之后,新数据写入前需要对NAND中的Block进行擦除,并同时搬运Block中仍然有效需要保留的数据,这会造成SSD写性能下降。也有人管稳态叫“极度脏盘”。

image011.png

新盘或格式化之后的SSD,由于里面并没有任何有效的用户数据,因此随机写时可直接落盘,不需要进行GC,此时性能会比较高,如,PBlaze7 7940 30.72TB的初始4K随机写性能大约为760K IOPS,在大约一遍全盘填充后,GC大幅度介入,开始出现性能下降;而随着GC的持续,SSD的随机写性能逐渐回升,并最终稳定在大约420K IOPS。

image013.png

4K随机读方面,由于主控Flash通道挂载的Die数量实在太多,加上内存Die数量因素,PBlaze7 7940 30.72TB要比7.68TB稍微低一些,最高为2777K IOPS。QD1性能为17K IOPS,延迟为58μs。

image015.png

4K随机写方面,PBlaze7 7940 30.72TB最高为440K IOPS,此时压力为QD256,对于30.72TB的SSD来说,是顶尖水平。作为对比,目前使用QLC的企业级SSD,稳态下4K随机写性能最高约为200K IOPS(同样有小海豚创造,型号为7340)。

image017.png

4K随机混合,7读3写测试环节,PBlaze7 7940 30.72TB在QD1024时达到1420K IOPS,同样也是顶级的性能。

image019.png

顺序读写性能测试开始前,同样需要进行预处理,即格式化SSD,再进行128K顺序填充全盘两遍。

image021.png

从结果可以看到,PBlaze7 7940 30.72TB始终保持在9GB/s以上的写速度,没有任何大幅度的性能毛刺,同时也没有出现如消费级SSD那样的大幅降速。因此,AIDA64的Linear Write测试就免了吧。

image023.png

PBlaze7 7940 30.72TB同样支持预读功能,简单说就是SSD在压力较小的顺序读任务中,可以提前预判下一个即将读取的LBA地址,大幅缩短读行为耗时。在QD1时,可以看到读带宽达到3.3GB/s。

image025.png

随着读压力的增加,在QD64时,PBlaze7 7940 30.72TB的读带宽达到14GB/s。

顺序写性能方面,PBlaze7 7940 30.72TB最高达到9.88GB/s,同样也是此容量SSD的最高性能。

image027.png

基准性能的测试,一个FIO基本就足够了,这个也是每一名用户都能获得的裸性能,如果套上上层应用,那就千差万别了,没有对比,也就没有太强的可参考性。

从FIO测试结果来说,PBlaze7 7940 30.72TB在保持超高容量、超大的硬件规模基础上,很好的克服了过多的Die挂载导致的性能问题,整体性能仍然可以接近8TB满性能版本,总体而言非常优秀。

个人应用性能测试

如此大容量的SSD,如果放在个人使用场景,是否可行?本环节切换至Windows 11操作系统,进行3DMARK的跑分验证。至于为何选它,理由也非常简单:因为耗时可接受。

image029.png

3DMARK Storage Benchmark是针对SSD游戏性能的基准测试工具。SSD的小压力的顺序读性能及延迟表现,是影响3DMARK跑分高低的关键。同时,CPU和内存性能也会对测试结果产生一定印象,如7A40不同媒体的3DMARK测试成绩,因测试平台配置不同,可以差出600分!

需要指出,部分消费级SSD会全程使用SLC Cache来提高3DMARK的测试成绩,导致跑分很高,但用户日常使用根本就无法获得那样的高性能(毕竟日常游戏读取,是从TLC模式直读,而非SLC Cache加速),也不具备参考性。企业级SSD不存在SLC Cache读写加速的机制,因此跑分普遍要低一些,却也是用户真实可以获得的。

本环节PBlaze7 7940 30.72TB的最终成绩为2817分,也和此前FIO的128K顺序读QD1性能结果呼应得上。如果更换13或者14代i7处理器,相信可以突破3000分。还是那句话,不要简单的和消费级SSD对比跑分成绩,需要看本质。

image031.png

温度表现

不同于消费级M.2的8.25W,企业级SSD允许的功耗配置要高得多,可以达到25W,一些SSD允许达到35W。

PCIe 5.0 SSD由于更高的性能,导致一些品牌产品的实际功耗以及发热都要高一些,这一点在TweakTown等媒体的评测中也有提到。

PBlaze7 7940作为首批发布的PCIe 5.0 SSD,满负载下功耗是同期产品中最低的,这款32T也很好的继承了低功耗、高能效比的特点,在持续的顺序写过程中,室温大概24摄氏度,SSD的最高综合运行温度为51摄氏度,其中主控最高为64摄氏度,对于拥有如此庞大硬件规格的PCIe 5.0 SSD来说,算是非常优秀的成绩。

image033.png

总结

和上一次写体验分享一样,一直在纠结那些可选的测试项目,但想来想去,似乎都没太大必要,特别是一些软件在读测试中无法避开SLC Cache带来的加速影响,浪费时间,也浪费大家感情。作为电脑中唯一同时具备CPU、内存、硬盘、操作系统的独立组件,SSD非常复杂,对我来说,能以行业共识的方式,简单展示一下性能,供大家参考,就足够了。

如今,在各类存储行业展会上,AI、QLC,特别是AI+QLC,成为很多厂商分享的重点,似乎QLC取代TLC,已经势如破竹,势不可挡。但在我看来,未来很长一段时间,TLC都将继续存在,面对客户对于大容量、高存储密度的部署需求,诸如PBlaze7 7940 U.2 30.72TB、E1.S 15.36TB这样的产品出现,将从读性能、写性能、写寿命等方面,均带给客户更优的选择。试想一下,此前需要4台Gen3存储节点,如今只要1台Gen5存储节点,其总容量相同,总性能也相同,且不需要任何SCM作写加速,系统架构的设计也能变得简单且更易维护。

PBlaze7 7940 30.72TB在FIO基准性能测试中发挥出色,在不更换主控、NAND的前提下,提供了接近7.68TB的随机与顺序性能,使其成为性能最好的超大容量SSD。而这一次,小海豚也以不一样的方式,再一次展示了其卓越的硬件与固件研发功底 —— 仅使用单片PCB、没有额外的 IO Buffer,将 TLC SSD 的性能与存储密度再次提升一倍,也是目前存力密度最高的产品。

话说,7A40的32T,啥时候能有?已经等不及了!

评分

参与人数 3邪恶指数 +25 收起 理由
TernenceS + 10
hudizhoutube + 10
Wolverine + 5

查看全部评分

发表于 2024-12-18 14:54 | 显示全部楼层
只能远观
发表于 2024-12-18 15:13 | 显示全部楼层
比我小海豚大10倍……  现在5.0用什么转接卡好?
 楼主| 发表于 2024-12-18 15:16 | 显示全部楼层
cloud 发表于 2024-12-18 15:13
比我小海豚大10倍……  现在5.0用什么转接卡好?

准确说是8倍…… 5.0转接卡还不太好买到……
发表于 2024-12-18 15:21 | 显示全部楼层
斗胆问一下价格,是否可以拥有
 楼主| 发表于 2024-12-18 16:09 | 显示全部楼层
hcc0204 发表于 2024-12-18 15:21
斗胆问一下价格,是否可以拥有

2开头的5位数吧,我猜的。。。
发表于 2024-12-18 17:49 | 显示全部楼层
本帖最后由 巴特沃斯 于 2024-12-18 17:52 编辑

淘宝现在的便宜5.0线是可以实际跑出PCIE 5.0(用了一周没啥问题),跑oracle的VDbench和一致性也没啥异常。
不知楼主是什么身份,有没有条件测转接线本身。

另外...CD8P-R(7.68)的3Dmark居然比你7940测得高不少.明明QD1的iops和延迟都是凯侠更差。(13K iops,亦即53mb/s左右4K Q1T1读,延迟70微秒,系统为winServer2025)
凯侠还是用16*512g+256,b5颗粒做双板搓的7.68
 楼主| 发表于 2024-12-18 17:57 | 显示全部楼层
本帖最后由 wuqiong0927 于 2024-12-18 17:58 编辑
巴特沃斯 发表于 2024-12-18 17:49
淘宝现在的便宜5.0线是可以实际跑出PCIE 5.0(用了一周没啥问题),跑oracle的VDbench和一致性也没啥异常。 ...


我自己没有条件测试转接线。。

回到 CD8P-R 这部分,7940的32T,运行3DMARK分数一般,这个测试主要受 128K顺序读QD1性能影响,同时4K随机QD1的延迟也有很大因素。得看看 CD8P-R 的 128K QD1顺序读是多少的带宽。即,4K随机QD1影响的是找到文件的速度,128K顺序QD1影响的是游戏文件的实际加载速度。

作为对比,7940的7.68T 分数就会高很多,7A40的7.68T,媒体跑3DMARK超过4300分了,我的测试平台性能不行,跑7A40也只能跑到 3800分。
发表于 2024-12-18 18:26 | 显示全部楼层
容量大于一切
发表于 2024-12-18 18:29 | 显示全部楼层
本帖最后由 巴特沃斯 于 2024-12-18 19:30 编辑
wuqiong0927 发表于 2024-12-18 17:57
我自己没有条件测试转接线。。

回到 CD8P-R 这部分,7940的32T,运行3DMARK分数一般,这个测试主要受 12 ...



23H2下测得的数据,这个系统里面屎比较多,跑IO有些许掣制

铠侠的SeqQ1T1基本都是最高标称除以8就差不太多了,中等队列就能摸到上限,但其表现也并不突出。
QQ截图20241218192651.png
发表于 2024-12-18 23:39 | 显示全部楼层
这太狠了!!!
 楼主| 发表于 2024-12-19 08:29 | 显示全部楼层
巴特沃斯 发表于 2024-12-18 18:29
23H2下测得的数据,这个系统里面屎比较多,跑IO有些许掣制

铠侠的SeqQ1T1基本都是最高标称除以8就差不 ...

所以 3DMARK 能跑多少分呢?
发表于 2024-12-19 08:50 来自手机 | 显示全部楼层
好不容易用了4TX2
你就来了30T

我总是跟不上时代呀
发表于 2024-12-19 08:50 | 显示全部楼层
U.2 - PCIe 的转接卡有什么好的推荐吗?一直用线,对转接卡不放心,但是又觉得现在机箱线太多。
 楼主| 发表于 2024-12-19 09:04 | 显示全部楼层
CuteCat 发表于 2024-12-19 08:50
U.2 - PCIe 的转接卡有什么好的推荐吗?一直用线,对转接卡不放心,但是又觉得现在机箱线太多。 ...

暂时没有,那些测试机构的转接卡都是贵的飞起,我这个也是厂商提供的,再等等,估计过不久就有靠谱的了
 楼主| 发表于 2024-12-19 09:04 | 显示全部楼层
kanshui 发表于 2024-12-19 08:50
好不容易用了4TX2
你就来了30T

不如直接企业级8T,其实并不贵。。。
发表于 2024-12-19 09:35 | 显示全部楼层
查了一下啊这牌子很不便宜呀。。。
 楼主| 发表于 2024-12-19 09:40 | 显示全部楼层
orangestreet 发表于 2024-12-19 09:35
查了一下啊这牌子很不便宜呀。。。

关键是便宜的很多也没好货啊。。。
发表于 2024-12-19 09:45 | 显示全部楼层
本帖最后由 orangestreet 于 2024-12-19 09:47 编辑
wuqiong0927 发表于 2024-12-19 09:40
关键是便宜的很多也没好货啊。。。


请教一下你说的没好货是什么标准?
你主要是什么场景在用这种大容量U.2硬盘?
 楼主| 发表于 2024-12-19 10:03 | 显示全部楼层
orangestreet 发表于 2024-12-19 09:45
请教一下你说的没好货是什么标准?
你主要是什么场景在用这种大容量U.2硬盘? ...

去年市场价格低迷,很多杂牌SSD出现,价格很便宜,主要问题是丢数据、掉盘。有时候性能不是第一位的,但存进去的数据,必需能读的出来,这个是硬盘的最基本职责与衡量标准。高端消费级SSD使用不合格颗粒导致数据出错的也不是没有。

我只是做分享,我个人也不存在这种高性能、大容量同时需求的使用场景,但是对企业来说,特别是AI大模型训练,可能需要很多的GPU,占用大量的PCIe,那么,就相应的需要提高存储密度与存储性能密度,不然 intel 的大容量 QLC,也不能出货达到 上百EB 容量规模了。
发表于 2024-12-19 14:37 | 显示全部楼层
wuqiong0927 发表于 2024-12-19 08:29
所以 3DMARK 能跑多少分呢?


20241219142410.png
其实我直呼高的多的成绩是4200,但似乎没跑出来
检查了下链路也是5.0x4并没有抽风(好吧其实我也对179块能跑5.0将信将疑,现在还算在考核期)
上班要紧先溜了

CPU是7800X3D 全默认
 楼主| 发表于 2024-12-19 15:39 | 显示全部楼层
巴特沃斯 发表于 2024-12-19 14:37
其实我直呼高的多的成绩是4200,但似乎没跑出来
检查了下链路也是5.0x4并没有抽风(好吧其实我也对179 ...

嗯,这个分数确实相当不错了,如果要比对,只能把这两个盘放在相同的CPU测试平台。
发表于 2024-12-19 17:45 | 显示全部楼层
太快了
我只想要100块/T左右 30T起  放nas里想想就很香 8盘直接200多T 再也不容量焦虑了
 楼主| 发表于 2024-12-19 17:53 | 显示全部楼层
Marbury 发表于 2024-12-19 17:45
太快了
我只想要100块/T左右 30T起  放nas里想想就很香 8盘直接200多T 再也不容量焦虑了 ...


此需求价值一辆迈腾380……如果算上满性能NAS,价值一辆 A4L 45TFSI Quattro……
发表于 2024-12-19 20:53 | 显示全部楼层
看看就行了
发表于 2024-12-19 23:59 | 显示全部楼层
就看看。。。。反正买不起。。。
 楼主| 发表于 2024-12-20 08:33 | 显示全部楼层
kanshuderen 发表于 2024-12-19 23:59
就看看。。。。反正买不起。。。

昂。。我也是就试试,买不起。。。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-12-22 11:51 , Processed in 0.017866 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表