E3C246D4U2-2T 问题困扰,有大神遇到么?【已解决】
本帖最后由 mshtyu 于 2025-2-25 20:00 编辑咸鱼上收的,看起来很新的,用了半年多,以前都是掉nvme的小问题,近期开始频繁发生问题,大神帮着判断下是不是主板要嗝屁:
E3C246D4U2-2T,功能很棒,最新bios+bmc,之前是pve,老掉nvme,这个应该是linux的老问题,换了7、8次以后总算消停点;后来换成esxi6.7 稳定了一段时间,就开始出现奇怪的问题:
pcie6和4,支持拆分8+4+4,8给了显卡,4+4给了双nvme卡,pcie5上插了一张4口2.5g乐扩,cpu cc150, 内存4条插满2X32+2X16,只有一个虚拟黑群晖,直通了显卡、网卡、双nvme 以及板载sata controller
从某一天开始,黑群晖关机后无法启动,提示:
无法建立传输连接 (9): There is no VMware process running for config file /vmfs/volumes/678c6d57-1438cdfa-4fab-88c9b3bb7a25/DSM-Main/DSM-Main.vmx
google了官方support、reddit,好像是个无解,什么名字空间冲突
偶尔重启esxi,又可以启动,单启动后会出现直通的pcie设备不能识别的情况:掉nvme盘、网卡挂掉、显卡找不到等等,此时通过impi看到的主机pcie设备是都能识别的(也有掉一个nvme的情况)
试过重装esxi和黑群,问题依旧
试过sysin最新的6.7,也会出现上述情况,并且偶尔会紫屏,提示 cpu 轮数超限,deadlock之类的
换过网卡,问题照旧
把几个直通设备都去掉,黑群可以正常启动
esxi8 还没试,求助各位大神,这个板子的pcie口都挂了么?
========================================================
综合楼下各位的意见,换了500w的电源,原来250w;换了esxi8,貌似系统健壮些,几个pcie硬件,该掉还是掉…… 直通的显卡时不时启动就不见了,直通的乐扩2.5g,一打就挂,几秒钟就不通了,打算放弃这张卡了,换i226;发现板子自己带的10g网卡,esxi8下虚拟化也是很健壮的,持续2.5g压测目前还没出事,实在不行就虚机单网口。
持续折腾,有情况再向各位汇报,感谢!
========================================================
虚拟黑群dva3219掉直通显卡的问题找到了:nvidia驱动的问题,官方驱动440版本太低,换成皮蛋熊的535版本,重启就不再掉显卡了;不是esxi的锅。
之前的问题是:第一次启动群晖能看到显卡,再重启就看不到了,必须esxi主机重启才能恢复,群晖再次重启还会丢显卡;英文世界里找到类似的几个问题,也都是推测驱动的问题,就试了一下……不枉我折腾几个周末熬夜翻网页
没试过7.0u3或者8.0? nn1122 发表于 2025-1-22 11:00
没试过7.0u3或者8.0?
没试过7,要用螃蟹的2.5g网卡 这板子我也有一块,挺稳的;命名空间冲突把硬盘完整格式化下就好了;exsi直通有问题,pve直通试下呢,不大可能pcie全坏了,掉盘建议检查下电源和硬盘散热 本帖最后由 mshtyu 于 2025-1-22 12:42 编辑
mk5250 发表于 2025-1-22 11:05
这板子我也有一块,挺稳的;命名空间冲突把硬盘完整格式化下就好了;exsi直通有问题,pve直通试下呢,不大 ...
esxi重装过几次,都是完整抹掉系统盘的,还是会出现 找一张I210的卡,然后装ESXI8后看看,不影响PCIE的直通 我用过这张板子,感觉是pcie插槽兼容性不太好,尤其是pciex1的插槽,我换了三种转接卡均有兼容性问题,系统是unraid,第一张是pcie转nvme双盘卡,结果双盘组raid1状态下全速读写必然掉盘死机,第二张是pcie转四盘ngff卡,虽然没死机掉盘问题,但系统日志会时不时报硬盘错误并已重置恢复,第三张是pcie转nvme单盘卡,结果主板压根点不亮,然后才发现甚至连bmc都启动不了 23年刚入手时也是搭的CC150,PVE下同样的SSD和pcie问题,换SSD,换网卡,各种折腾!为了这张板子一度自闭,后来一怒之下换了个ES的2288G和4条ECC,后来陆陆续续加了pcie一张X540T2、一张双口226-V、一个SATA扩展卡,装了esxi8,最后稳稳的跑了400多天,前段时间才出掉。总感觉这板子比较挑硬件,依稀记得当时网上找这块板子的资料基本为无……各种瞎折腾 正如楼上所说,这版子的PCI比较挑,兼容性不太好 服务器工作站的板子的确超微的支持比华擎好太多了 你这个内存用法就是错的 mdk2000 发表于 2025-1-24 15:25
你这个内存用法就是错的
谢谢,同型号的一对条子在路上 我是这板子+CC150+64G装了3个虚拟机,一个爱快,一个OP,一个飞牛 底层是WINSERVER 2019 目前表现良好,持续在线,没有用拆分卡,整体表现良好 kingqueen 发表于 2025-2-14 16:24
我是这板子+CC150+64G装了3个虚拟机,一个爱快,一个OP,一个飞牛 底层是WINSERVER 2019 目前表现良好 ...
CC150是不是不支持ECC insomnia417 发表于 2025-2-24 20:11
CC150是不是不支持ECC
应该不支持吧我用的普条16*4 刚刚入手这个板子,挺担心的,这个掉pci硬件是通病吗?esxi系统下面也会开机掉nvme吗? gycm01 发表于 2025-1-23 02:01
23年刚入手时也是搭的CC150,PVE下同样的SSD和pcie问题,换SSD,换网卡,各种折腾!为了这张板子一度自闭, ...
esxi8下面有兼容性问题吗?我买了一张来替代超微x11ssh,这个板子的pcie分布更合理,如果没有pcie问题那妥妥的skylake神板啊 Staryest 发表于 2025-3-14 20:31
esxi8下面有兼容性问题吗?我买了一张来替代超微x11ssh,这个板子的pcie分布更合理,如果没有pcie问题那 ...
应该没有了,从我遇到的pcie的硬件来看,都不是主板的锅,
显卡是驱动的锅;
网卡是硬件自己的锅;
nvme掉盘是nvme自己的锅;
都能搞的掉头发…… c3c256d4i也掉nvme。但是可以避免。
- 如果系统开机后,不论是esxi还是pve,操作系统选择关机必掉驱动。
- 如果此时关闭电源,再重新开机,则不掉nvme
总结起来就是上电第一次启动没问题 后面reboot也没问题 但是shundown之后必须断电,否则重启必掉nvme
summerq 发表于 2025-3-17 13:00
c3c256d4i也掉nvme。但是可以避免。
- 如果系统开机后,不论是esxi还是pve,操作系统选择关机必掉驱动。
-...
嗯,据说,是linux kernel 处理nvme节电后唤醒的超时处理机制有关,影响到好多系统,国外的坛子里有说可以通过修改bios里对应pcie的某个等待时间参数,或者修改启动内核参数指定这个时间来解决(或者缓解);
================================
WD SSD SN750 突然離線,檔案系統進入 Read-onlyhttps://danny50610.github.io/2022/07/14/wd-sn750-ssd-offine.html
最后的解决 https://danny50610.github.io/2022/07/31/wd-sn750-ssd-offine-part2.html
+++++++++++++++++++++++++++++++++
那win的呢?掉盘的盘在win下也掉的嘎嘎响……
我最近又在退换货了,plus还是香…… 最近涉及到的牌子是:
1、烂豆腐 1T,sl700,原本一直夸它,就它不掉,结果发现新的批次,用了梵想的主控,开始掉;
2、梵想1T,s500pro,4条,有1条掉,其他3条暂时很稳
页:
[1]