(gaojie20@原创Chiphell,转载请注明出处)
SK集团作为韩国的龙头企业集团, 引领着能源与化工产业的发展, 并为IT与半导体产业注入创新动力, 通过创造价值巩固其在全球市场上的主导地位。hynix几十年来一直是DRAM和NAND世界巨头之一,与三星和美光一起一直主导着内存和闪存市场,几年前,1983年成立的hynix公司被出售给韩国大型企业集团“SK集团”,因此得名“SK hynix”。 值得注意的是,SK hynix不仅是SK集团的核心子公司, 更是全球三大半导体制造商之一。
▲来自Omdia 2023年4月的数据显示:2022年,SK hynix在全球DRAM与NAND市场上都位居第二。 2021年SK hynix决定以90亿美元收购Intel的NAND业务并成立子公司Solidigm进行业务拓展。
▲自从之前评测了SK Hynix PE8010 3.84TB U.2之后便对这个品牌久久不能忘怀,但是之前SK Hynix 无论企业级还是消费级都只在国外销售,购买比较困难,直到最近JD自营开始上架SK Hynix了,才有机会购买到SK Hynix Platinum P41 2TB M.2 SSD。
▲SK Hynix Platinum P41 2TB是一款PCIe4.0 x4的M.2 SSD产品,支持NVMe 1.4协议,持续读写分别达到7000/6500 MB/s
▲耐久度达到1200 TBW,官方保修五年,下面我们就来一探究竟。
▲包装正面
▲包装背面
▲开箱
▲SSD本体正面。
▲SSD本体正面,可以看出很明显的单面SSD。
2▐ 芯片解析
▲SSD正面裸片
▲Controller:SK Hynix ACNS075
SK Hynix ACNS075这颗主控的代号是Aries,是一颗3核ARM Cortex-R8 + 单核Cortex-M7的SoC,其中1核Cortex-R8+1核Cortex-M7负责Host,双核Cortex-R8负责FTL,TSMC 12nm制程制造。支持NVMe 1.4协议,8通道,每通道4CE,总支持32CE,支持最高速度为1600MT/s的NAND。
▲DRAM:SK Hynix H9HCNNNBKUMLXR-NEE
SK Hynix H9HCNNNBKUMLXR-NEE 是一颗LPDDR4-4266的DRAM,容量是2048MB。
NAND:SK Hynix H25T3TCG8CX590 x2
▲SK Hynix H25T3TCG8CX590是 SK Hynix v7 4D NAND,176-layer堆叠TLC,速度是1600 MT/s。每颗NAND由2个chip组成,每个chip由8个512Gb的Die组成,所以一颗NAND由16Die堆叠而成,每Die接驳一个CE,共计16CE。
两颗NAND正好32Die接驳32CE,正好塞满Aries的32CE上线,准确来说SK Hynix Platinum P41 2TB是这个系列的满血版本。
▲这颗176L的Die是有型号的,SK Hynix内部编号为H25HTC0,参数如上图所示。
SK Hynix 的176L以11.01GB/mm2的存储密度一骑绝尘,高于Samsung 176L的10.87GB/mm2以及Micron 176L的10.27GB/mm2。
3▐ Windows 11测试
3.1▐ 测试平台
▲测试平台:
CPU:AMD Ryzen 9 7900X
主板:ASRock X670E TAICHI
内存:SK hynix DDR5-4800 2RX8 UDIMM 32GB x2
显卡:PNY Geforce RTX 4080 16GB
SSD:SK Hynix Platinum P41 2TB M.2
SSD:Lexar NM800 2TB M.2
水冷:SLIVERSTONE IG360
电源:SEASONIC GX1000
3.2▐ SMART
▲固件版本是51060A20,确认是支持NVMe 1.4协议。
3.3▐ SK hynix Driver Manager Easy Kit 2.7.0
▲SK hynix Driver Manager East Kit 2.7.0主界面
▲其实smart这些都没有什么特别的地方,比较特别的是增加了可选择性的TRIM主动操作选项
▲升级固件也会比较简单,但是不支持网络OTA,仅仅支持固件包上传更新。
3.4▐ smartmontools
▲通过smartmontools可以探知到一些CDI获取不到的smart信息,比如这个盘的Supported Power States有五档,分别设定在:
PS0=7.5W、PS1=3.9W、PS2=1.5W、PS3=0.05W、PS4=0.005W。
3.5▐ TRIM
▲向SSD里写入一个16M的文件,这文件头的前16位字节如上图白色区域所表示,这也是该文件唯一的文本字符串,然后将其删除,如果TRIM工作,控制器也将删除这个数据,这时候软件让你等待大约20秒后然后按ENTER继续,然后关闭软件再次打开。
▲再次打开软件,提示原白色区域的字节已经被0所填充,说明主控固件的TRIM机制有效。
3.6▐ 性能定标
▲CrystalDiskMark 8.0.24的持续读写使用QD32T1的默认设置,随机读写使用QD32T20的条件,可以非常接近官标所标识的UP TO的最大值:
Sequential Read [持续读取](Q=32,T=1) : 7367 MB/s > 7000 MB/s(官标)
Sequential Write [持续写入](Q=32,T=1) : 6625 MB/s > 6500 MB/s(官标)
Random Read 4KiB [4K随机读取](Q=32,T=20) : 1320 K IOPS
Random Write 4KiB[4K随机写入] (Q=32,T=20) : 985 K IOPS
4▐ SNIA PTS评估验证
▲全球网络存储工业协会(Storage Networking Industry Association,SNIA)是成立时间比较早的存储厂家中立的行业协会组织,宗旨是领导全世界范围的存储行业开发、推广标准、技术和培训服务,增强组织的信息管理能力。作为一家非盈利的行业组织,拥有420多家来自世界各地的公司成员以及7100多位个人成员,遍及整个存储行业。它的成员包括不同的厂商和用户,有投票权的核心成员有Dell、IBM、NetApp、EMC、Intel、Oracle、FUJITSU、JUNIPER、QLOGIC、HP、LSI、SYMANTEC、HITACHI、Microsoft、VMware、Huawei-Symantec十五家,其他成员有近百以上,从成员的组成可以看出,核心成员来自核心的存储厂商,所以SNIA就是存储行业的领导组织。在全球范围SNIA已经拥有七家分支机构:欧洲、加拿大、日本、中国、南亚、印度以及澳洲&新西兰。
Solid State Storage Performance Test Specification Enterprise v1.0是SNIA于2011年给Enterprise SSD都制定了Performance Test(性能测试)的规范,可以到其网站www.snia.org下载。
▲系统及设置
操作系统
• Kernel Version: 6.3.0-060300-generic
• Description: Ubuntu 22.04.2 LTS
测试样品检测信息:
• sn : ADC7N402010107E16
• mn : SHPP41-2000GM
• fr : 51060A20
• frmw : 0x16
• tnvmcap : 0
• mntmt : 273
• mnan : 0
• subnqn : nqn.2023-07.com.skhynix:nvme:nvm-subsystem-sn-ADC7N402010107E16
• Device Interface: nvme
• Device Logical Sector Size: 512
• Device Physical Sector Size: 512
测试系统
• Cpu:AMD Ryzen 9 7900X
• MB:ASRock X670E TAICHI
• Fio Version: fio-3.28
• Date of test run: 2023-10-29
• Number of jobs: 2
• Number of outstanding IOs (iodepth): 32
使用了T2线程进行测试是因为双核环境我相信是目前最广普的环境。QD32的深度也是服务器比较常见的存储应用深度。
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
每一轮测试包含.512B,4K,8K,16K,32K,64K,128K,以及1MB数据块大小,每个数据块在100%,95%,65%,50%,35%,5%和0%运行读/写混合测试,各为一分钟。试验由25回合(Round)组成(一个循环需要56分钟,25回合=1400分钟)
使用4K随机写入的IOPS作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准。
在SNIA组织定义的规范中,规范了如何测试闪存设备或固态存储。业界希望有一种来比较SSD的科学方法,这也是需要SNIA测试规范的原因。SSD的写入性能在很大程度上取决于NAND的写入历史。SSD一般有三个写阶段:
▲
1、FOB(全新从盒子里拿出来的状态)
2、Transition(过渡)
3、Steady State(稳定状态)
以上图例来自SINA PTS 1.1测试规范
Transition(过渡)过渡是FOB和稳态的良好表现之间的阶段。大多数情况下,性能会随着时间的推移而持续下降,直到达到稳定状态为止。SNIA PTS1.1的测试规范则很严格的监控了FOB到稳定态的每一个阶段,以及评估标准帮你去确认你的企业级SSD确实达到了稳定态,所以根据以上溯源我们有了预处理的过程。
预处理的128K数据块大小持续写入双倍SSD容量这个过程进行了近2个小时。可以说还是非常快的,我通过NETDATA记录下这个过程并可视化展现。
▲预处理测试的数据块大小始终维持在128K。
▲预处理的阶段的写入速度变化,速度单位MB/s,最高点写入速度6466.9MB/s。
▲预处理阶段的SSD主控和NAND的温度变化,最高点温度:主控Sensor1为59度,NAND Sensor2为78度。
预处理的过程符合FOB--Transition--Steady State的速度过渡特征,较为平滑,无0值数据出现。
IOPS测试里面的【回合】是:在512B,4K,8K,16K,32K,64K,128K,以及1MB数据块大小下,每个数据块在100%,95%,65%,50%,35%,5%和0%运行读/写混合测试,各为1分钟,整个测试组成一个回合,每个回合共耗费56分钟。
▲上图为一个完整【回合】的数据块大小变化的可视化展现过程,绿色为读取,红色为写入,纵坐标是数据块大小,横坐标是时间,耗时56分钟。
▲上图为一个完整【回合】的IOPS可视化展现过程,绿色为读取,红色为写入,纵坐标是IOPS,横坐标是时间,耗时56分钟。
▲上图是一个IOPS测试中完整达到稳定态的多回合测试,绿色为读取,红色为写入,纵坐标是数据块大小,横坐标是时间。可以看到一共有25回合,这是因为在(20,21,22,23,24)回合中,连续5个回合的4K随机写入的IOPS振幅高于20%平均值,连续25回合都没有连续5个回合达标,则显示测试不通过。
▲25回合的读写速度变化,绿色为读取,红色为写入,速度单位 K IOPS。从这个图可以大致观摩到这块SSD每隔2个回合就会有一次高峰IOPS表现的回合出现,导致连续5个回合的4K随机写入的IOPS振幅高于20%平均值,这应该是其SLC Cache或者GC的激进机制的表现。作为一个消费级SSD,过不过企业级的PTS标准测试也没啥关系,但是从曲线中我们可以探究其原因,是盘真的很烂还是GC机制做的过于激进,前者的话没得救,后者的话,降低点速度让GC机制没那么激进就可以很轻松通过测试,很显然P41是后者!
▲25回合的温度变化,Sensor1为主控温度,Sensor2为NAND温度。
下面我们来看下测试结果
▲IOPS稳态收敛图-QD32
显示相关变量如何试图收敛到稳定状态的过程,可以看得出,固件在玩命的拉4K IOPS,掉下去就给迅速拉上来,又掉继续接着拉,这种操作过于频繁了导致曲线的稳定性表现就会比较差。
▲IOPS稳定态验证图-QD32
显示直到([20,21,22,23,24]) 回合,窗口计量的IOPS分别是([61514, 81643, 46771, 66003, 77029]) ,均线的IOPS: 66592。这里需要说明的是,P41 2TB的4K随机写入性能参考均线的振幅超过了均值20%的虚线,所以这里判定25回合不能进入稳态。
▲IOPS测试2D图-QD32
▲IOPS测试3D图-QD32
通过IOPS测试之后,系统会执1次Secure Earse安全擦除,继续执行1次预处理(128K数据块持续写入双倍SSD容量),然后执行延迟测试(LAT)。
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
对于['8k','4k','512']数据块大小进行100%读,65%读35%写,100%写的随机读写测试,测量最大最小以及平均的延迟,60秒为一个回合(Round)
使用4K随机写入的平均延迟作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
预处理的128K数据块大小持续写入双倍SSD容量这个过程和之前一样持续进行了近2.5小时。我通过NETDATA记录下这个过程并可视化展现。
▲预处理测试的数据块大小始终维持在128K。
▲预处理的阶段的写入速度变化,速度单位MB/s,最高点写入速度6460MB/s。
▲预处理阶段的SSD主控和NAND的温度变化,最高点温度:主控Sensor1为56.85度,NAND Sensor2为77度。
预处理的过程符合FOB--Transition--Steady State的速度过渡特征,较为平滑,无0值数据出现。
▲上图是一个LAT测试中完整达到稳定态的多回合测试,绿色为读取,红色为写入,纵坐标是数据块大小,横坐标是时间。可以看到一共有5回合,明显没有达到25回合,这是因为([0, 1, 2, 3, 4]) 回合中,连续5个回合的4K随机写入的IOPS振幅低于20%平均值,所以这里默认进入稳定态,测试通过。如果连续25回合都没有连续5个回合达标,则显示测试失败。在([0, 1, 2, 3, 4]) 回合进入稳定态是这个测试得最优解!
▲5回合的读写速度变化,绿色为读取,红色为写入,速度单位 K IOPS。
▲5回合的温度变化,Sensor1为主控温度,Sensor2为NAND温度。
▲延迟稳定态收敛图-QD32显示相关变量如何收敛到稳定状态的过程
▲延迟稳定态确认图-QD32显示了4K随机写入过程中,在([0, 1, 2, 3, 4]) 回合达到了稳定态,窗口计量数值为([17.487967, 17.767742, 17.704678, 17.268237, 17.112289]) us。均线为17.4681826 us,耗费最少的回合,说明稳定性很好。
▲平均延迟在所有进程中的表现在0.08毫秒以内。对4K重度优化的痕迹非常明显。
▲最大延迟在所有进程中的表现在120毫秒以内。随机读以及混合读写部分是最大延迟控制的极好在18毫秒以内,随机写的部分最大延迟相对较高。且可以很直观看出固件对4K随机读写以及混合读写的重度优化,下手还是非常狠的,直接放弃512B和8K直接奔赴4K,很明显的主流消费级SSD的优化套路。
▲平均和最大延迟3D图-QD32以及汇总数据。
测试方法
进行Secure Erase安全擦除
对于['1024k', '64k', '8k', '4k', '512']数据块大小进行持续读写60秒为一回合(Round)
使用1024K持续写入的吞吐量作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
▲上图是一个TP测试中完整达到稳定态的多回合测试,绿色为读取,红色为写入,纵坐标是数据块大小,横坐标是时间。可以看到一共有25回合,这是因为并没有连续5个回合的1024K持续写入的IOPS振幅低于20%平均值,所以默认需要跑完25回合。
▲25回合的读写速度变化,绿色为读取,红色为写入,速度单位GB/s。
▲25回合的温度变化,Sensor1为主控温度,Sensor2为NAND温度。
▲带宽稳态收敛图-QD32显示相关变量如何收敛到稳定状态的过程,这里可以看出1024K的持续写入曲线还是具备一定规律性的,0回合高值,1、2、3、4回合低值,5回合拉回高值,这就类似一个循环,6回合又开始这个循环,这就导致很难连续5回合有稳定一致的均值数据。
▲带宽稳定态验证图-QD32
显示直到([20,21,22,23,24]) 回合,窗口计量数值为([4319.200, 4265.554, 4267.855, 4260.942, 4264.659])MB/s,均线数值在 4275.642MB/s。。这里需要说明的是,P41 2TB的1024K持续写入性能参考均线的振幅超过了均值20%的虚线,所以这里判定25回合不能进入稳态。
▲读写带宽测试2D图-QD32
▲我们可以看到稳定态下持续读写各个数据块下的平均表现力。
测试方法
进行Secure Erase安全擦除
执行4K随机写入1分钟为一回合(Round),写入4倍全盘容量或者24h,以先达到者为准
计算各个回合的平均IOPS(Avg IOPS)
▲上图是一个WRITESAT测试中完整达到稳定态的多回合测试,红色为写入,纵坐标是数据块大小,横坐标是时间。一共有64回合写满了全盘4倍容量。
▲64回合的读写速度变化,红色为写入,速度单位IOPS。
▲64回合的温度变化,Sensor1为主控温度,Sensor2为NAND温度。
▲写饱和平均IOPS图-QD32
这个测试实际写入也就64回合写满4倍全盘容量,平均速度约在505000 IOPS,曲线很稳定几乎一条线
▲写饱和平均延迟图-QD32
测试跑在0.125毫秒附近以内一直到测试结束.
没有对比就没有伤害,我们这次选用了几款SSD产品进行SNIA PTS测试后进行对比:
企业级组:
SKhynix PE8010 3.84TB U.2
无缓存消费级组:
Lexar NM760 1TB M.2
WD SN770 1TB M.2
有缓存消费级组:
Samsung 980Pro 1TB M.2
Plextor M10P 2TB M.2
▲IOPS测试环节综合来看,企业级SKhynix HFS3T8GECVX124N 3.84TB U.2有着无可比拟的优势,Samsung 980Pro 1TB M.2和SKhynix P41 2TB紧随其后,这个测试有缓存版本和无缓存版本差异较大。
▲LAT延迟测试环节,表现最好的是Samsung 980Pro 1TB M.2,SKhynix 自家的HFS3T8GECVX124N 3.84TB U.2以及 P41 2TB表现紧随其后,这三者和其他SSD拉开较大的差距。
▲TP带宽测试环节,SKhynix 自家的HFS3T8GECVX124N 3.84TB U.2以及 P41 2TB表现优异,Samsung 980Pro 1TB M.2表现紧随其后,Plextor M10P 2TB M.2读写都很平衡在这个测试里倒是异军突起。
▲WRITESAT写饱和度测试环节,容量不一样其实没法客观比较,完成测试的时间不能作为参考,要看纵坐标IOPS,SKhynix 自家的HFS3T8GECVX124N 3.84TB U.2以及 P41 2TB还有Samsung 980Pro 1TB M.2占据前三甲,其中SKhynix自家两个产品表现稳定,Samsung 980Pro 1TB M.2起伏较大稳定性略差,这三个盘和其他盘拉开了较大的差距。
这个测试中,SKhynix产品是可以和Samsung掰手腕的存在,和其他产品拉开较大的差距。很明显SKhynix是以Samsung为对标去调整性能的。
然后我们来看一下整个测试跑了多长时间?
▲跑完全程上个基于数据块大小的SNIA PTS全程图,可以看到横坐标一共跑了34小时!34小时里面有22个小时在跑IOPS。
最后让我们分析一下这个盘在残酷的PTS验证压榨下的温度表现:
▲SNIA PTS测试全程的温度变化。可以看出75度是这个盘的温度阀,超过这个温度就会出发降速降温保护机制,虽然我跑这个盘温度触顶就那么几次,但是建议大家还是要使用主板自带的M.2盔甲或者购买散热片进行装护,确保这块SSD能发挥正常性能。
▲关于SLC Cache,128K QD32持续写入环节,发现四次SLC 峰值区域分别是295GB/236GB/165GB/89GB。
主控缓存闪存统一品牌的产品世界上目前只有三家:Sumsang、Micron以及SK Hynix。这边让我对SK Hynix的产品非常的期待,到手测试完毕,说实话没让我失望,确实有世界巨头的风采,内涵满满:
1、SK Hynix P41上可以看到PE8010 固件的影子,只不过P41为了在消费级上做出成绩,在优化4K随机读写以及1M持续读写的时候下手有点狠,导致这两个指标的SNIA测试性能浮动较大。这是因为消费级为了定标,会以提升SLC状态下的MAX UP TO的最大性能为目标调整固件参数,导致在进行企业级产品评测稳定度的时候就会吃亏一些。
2、砸掉SLC Cache外壳后,P41 2TB 4K随机读写以及1M持续读写给我留下了非常深刻的印象,这种脱壳之后依然硬派的作风明显是有的放矢,对标Samsung而来。延迟也控制的非常优秀,就大陆市场而言,SLC Cache脱壳之后除了Samsung,在性能上少有能与SK Hynix Platinum P41匹敌的产品。