本帖最后由 sansi 于 2022-12-10 21:43 编辑
最近想着给服务器增加几块硬盘,顺便改造一下硬盘供电,首先在某宝找了半天,发现都不太满意。突然想起一句名言,高端的电源,往往采用最朴素的实现方式。于是立马打开小黄鱼,摸索了一番,找到了一款通信电源模块。12V转5V,方案肯定没得问题,因为大部分的DC转ATX模块也是这种方案。话不多说,下单,开搞。
模块大概长这个样子,拆机件,被转接了一遍,反正也不贵,直接搞两个。
查了下资料,找到了一些,这么来看效率还不错。
这儿先说下理论计算,关于硬盘供电方面,最大的争议在于一块硬盘的启动功耗,需要多大的功率的电源。综合网上的各种讨论,我这里再分析一下。正常情况下,硬盘功耗最高就是电机启动瞬间的功耗,这里我用的是西数的紫盘,WD42EJRX系列,官网没找到相关资料,但是找到了同系列WD62XXXX系列的资料,这里可以看到,启动瞬间,12V供电需要1.75A电流,而正常工作电流只有300mA,整体功耗在5.6W左右。
我用的电源是海韵的GX500,参数如下图所示:
以本文中的硬盘数据和电源参数来做计算。
可以看到,3.3V和5.0V总计输出100W,而12V单独输出接近500W,这是一个很关键的信息。
首先是12V,我不带显卡,我们按30A,也就是360W计算,那么在启动瞬间可带3 0/1.75 ≈ 17块硬盘。 然后是5.0V,我有两个NVME固态,一个电流在3A左右,工作电压3.3V,就已经除去了 3*3.3*2 ≈ 20W,然后就是各种PCIE插槽,都需要3.3V,5.0V供电,还有USB也是5.0V,除去这些,在保留一部分,给硬盘算50W,也就剩下10A电流,计算一下,大概就是 10 / 0.43 ≈ 23块硬盘。 两者取最小值,也就是17块硬盘,看起来似乎没问题,但是我一块三星企业级固态SATA硬盘,就去掉了2A电流,一下子就干掉了4块硬盘数量,如果USB插个手机充电,激活快充,一下子就少2A甚至是4A电流。 因此,在我看来,一个电源能带多少块硬盘,完全由5V供电决定。 因为一般情况下,12V的供电是完全足够的,而且,作为服务器,也没谁没事天天去开关机,不过可惜的是,我找了很多电源,就基本上都是12V的输出功率在增加,3.3V和5V都是共享100W,这也是我打算升级电源的原因。 最后,以上数据全是基于西数紫盘来计算,如果是企业级硬盘,估计启动电流和5V电流会更大,这也是我不选择企业级硬盘的原因之一,无论是供电、噪音、发热都比较大,至于速度和安全性,我主要用ZFS组RAID-Z2,内存管饱,估计用企业盘也不会有太大提升。 等了好几天快递,阵列卡和电源模块这些东西都到齐了,那就直接开干, 首先是电源供电,既然我不用显卡,那直接就把显卡的连接线卡擦掉,然后给12V转5V模块供电。 虽然模块效率高,但也不能直接没散热,先搞几个散热片,给它夹上,之前搞的,没照片了,只有最终产品。
以下操作有风险,有风险!!有风险!!!重要的事情说三遍,没有专业工具和相关知识,请大家不要随便模仿,出事本人概不不负责。
测了一下空载电压在5.20V的样子,似乎超过5V,主要是考虑了线损,所以电压高了点,但是在硬盘供电要求的±5%以内,马马虎虎,而且,作为电子方面的技术人员,一般芯片标称5V供电,那么工作最大工作电压在5.3V样子,绝对损坏电压在5.6V的样子。
然后开始带载测试:
带载18A电流测试,直接把我的负载电阻干成了电灯,本来还想老化测试一下,后面直接废了。 此时ATX电源功耗在111W左右。
然后再次测了下带载电压,由于没有两个万用表,只能以ATX的功耗为参考。
ps:没错,负载给干没了,直接抽出电阻丝,继续干。
可以看到,此时电压掉到了4.78V,大约有0.4V的压降,后面才反应过来,应该直接测模块的输出,而不是负载两端,因为那几根线说不定就有0.3V的压降,不过一般情况下,只接硬盘也不太可能给干到18A的电流。可惜没有示波器,不然还能顺便测一下大电流纹波。
说到纹波,相信很多人听说因为纹波大,导致硬盘损坏,这个说法我不敢苟同,纹波一般也就一两百mv,如果四五百mv,那不叫纹波,那是你电源有问题。 而通常一块电路,都会自带滤波和退偶电容,所以大部分情况下芯片电源两端的纹波会比电源还小,对主板来说,纹波大有影响我还认同,对于硬盘来讲,5V的纹波能对它造成什么影响?其次是12V的纹波,一两百mv的纹波能对电机造成什么影响?所以更多的原因可能是电源有问题,而不是纹波。
接下来就是做线了,由于没有背板,只能用这种一转多的SATA供电线,按照SATA电源接口的定义,依次接线即可。
成品如下,3.3V供电不需要,我看过很多机械硬盘和固态硬盘资料,均没有3.3V供电需求,还是,大4PIN知道不,为啥只有四个引脚,也是去掉了3.3V供电,就算有,那也是硬盘内部通过5V降压得到。
硬盘供电告一段落,接下来是阵列卡散热改造。
整列卡这里我用的是LSI2308系列,相信大家并不陌生,这款卡设计初衷就是给服务器用,而服务器,空调、暴力风扇形成的风道,都不太会考虑散热问题,因此,这些卡的散热器都很小,但是家用不可能整什么暴力风扇吧。 因此,这款卡,家用,如果不对散热进行改造,那掉盘只是轻的,严重点直接G掉。 到手第一件事就是拆看散热器看看,不看不知道,一看吓一跳,这硅脂直接干透了,刮了半天才弄掉。
直接涂上上次CPU没用完的硅脂,在装回去,那么问题来了,如何监控阵列卡的温度呢,找了半天资料,都没查到个所以然,查到了一些,搞了半天也没搞出来,干脆斥巨资买一个电子温度计得了。
没想到,温度传感器没地方装,干脆用高温胶带给绑上面得了,也懒得拆下来了,夏天还可以再看看温度。
这只是第一步,怎么能换个硅脂就算完了,小风扇搞上。
没想到风扇还是大了,对了半天位置,干脆就打一颗螺丝算了,试了下,还挺稳,就是不知道长时间震动会不会掉下来,掉下来问题就大了。
一切准备就绪,开始装机,是首先,电源模块放哪是个问题,(由于考虑不周,SATA供电线还是短了),比划了半天位置,干退绑机箱顶上算了,刚好有一个硬盘没地方放,也绑在了上面。
我的扎带,居然找不到了,先用高温胶带缠着吧,哈哈~万能的胶带。
开机,上电,等待,貌似遗漏了一步,还没按下开关的我吓了一跳,上电前,打一下接口定义这么重要的事情,我怎么给忘了,虽说之前反复确认过,但是万一出事了,硬盘可就全部G了。
电源都已经全部装好了,再拆下来也麻烦,干脆把所有硬盘供电全部拔了,就没事了,反复测量基础,插好,重新上电。
整个机箱长这个样子,原谅乱糟糟的走线,反正盖子一盖,眼不见心不烦。
总计6+4+2 = 12 硬盘,已经塞满了,感觉还能叠几个固态SATA。
为了加强阵列卡散热,以及其他PCIE卡和南桥散热,又整了两个14cm风扇对着吹。
装好以后,怀着颤抖的心情,按下了开关,看着功率计上面正常的功耗,听到熟悉的自检声音,总算松了口气,等了半天总算进了系统,这里我用的是unraid系统,套娃truenas scale以及黑裙。
可以看到,正常识别硬盘,我新增了两块硬盘,这里我用一块新硬盘替换掉了truenas一块硬盘,一块给unraid做奇偶检验盘。
正常识别,可以看到是挂在SAS2308下面。
然后开始测试整列卡温度,红色为整列卡温度蓝色为室温,均在温度不发生变化时测量。
首先是整列卡上面小风扇工作与不工作的情况:
可以看到没有风扇温度温度为56.5℃,当前室温只有13℃,而且还是空载,这要是夏天那还得了,加了小风扇后爆降到29.1℃
然后是两个大风扇,效果居然不如小风扇,不过我看了下,风扇转速很低,IPMI里面调成满速也没太大作用,估计是风扇转速就那么高而已,不过,南桥(南桥也有小风扇)和附近的一个nvme固态温度下降不少,之前这个固态一直比靠近CPU那个高了10℃,现在只高4~5℃。
三个风扇一起转,整列卡也就下降1℃左右,本来打算去掉两个大风扇,想了想,还是都开上吧,好歹也可以给主板和PCIE卡降降温。以后夏天到了,再升级风扇吧。
接下来就是Truenas重建,一进去,就弹出了错误。
好家伙,重建要三天,吓了我一跳,我就6盘4T,raid-Z2,怎么要这么久,还好后面恢复正常了,只要8小时的样子。
Truenas重建放到一边,接下来是unraid添加奇偶检验,这也是主要加2块硬盘的原因,进而导致升级电源的原因。
Unraid阵列就三块硬盘,速度还行吧。
重建过程中,还作死从truenas中转移数据到unraid,速度很慢,估计是unraid的锅,至少我拷数据到truenas是跑满了我的1000Mbps接口。
最后再测一次温度,发现阵列卡是否工作,貌似对温度影响不大?
再次总结一下几次温度对比,一下数据基于室温13℃测量。
最后,补一张硬盘(Truenas重建阵列+unraid奇偶检验)全部工作时的功耗。
大部分稳定在130.9W左右,峰值会有170W,估计是CPU功耗。 之前试过,不插硬盘功耗在50W左右,现在有12块硬盘,平均每块硬盘功耗大概在(130-50)/12 ≈ 6.67W。
其中有一块希捷酷狼4T+2块希捷酷狼2T + 三星SATA固态 + 8块西数紫盘。
|