找回密码
 加入我们
搜索
      
楼主: coooool_boy

[CPU] 13代intel和7000锐龙生产力(科学计算和编译能力)测试汇总

[复制链接]
 楼主| 发表于 2022-11-21 09:38 | 显示全部楼层
HyperSPH 发表于 2022-11-20 21:39
楼主想法很不错,但是举手的不会多,cfd-online的硬件版块评测也不过如此。一方面门槛高,另一方面代码采用 ...

没事,我看还是有很多人愿意分享一些看法和观点,我觉得都挺好呀。至于说案例测试,确实费时费力,也可以汇总一些网上已有的测试,总之能给生产力用户形成一个参考,那就是这帖子的目的就达到了。
 楼主| 发表于 2022-11-21 09:39 | 显示全部楼层
人撞猪上 发表于 2022-11-21 02:49
Mpirun执行的那是16个进程不是线程

是进程,笔误了,哈哈。
 楼主| 发表于 2022-11-21 09:45 | 显示全部楼层
QSG 发表于 2022-11-20 22:29
为啥我觉得消费级测生产力没啥用

也不能这么说。确实,我们组也有3990x,还有epyc等工作站,但是,个人电脑还是要执行一些生产力项目的。用13代或者7000锐龙跑生产力,大概是研究生居多,有些研究生导师压根不会购买专业工作站,为了发文章很多学生都是自己配pc。所以,测试还是有一些参考价值的。
发表于 2022-11-21 09:53 | 显示全部楼层
aasa0001 发表于 2022-11-21 02:23
企业采购的服务器往往是渣渣,被ws秒杀,甚至不如msdt都很正常。

虚拟机装win10,跑r23
4路6240,72c144t
2路6342,48c96t
后者比前者高20%
 楼主| 发表于 2022-11-21 10:07 | 显示全部楼层
本帖最后由 coooool_boy 于 2022-11-21 10:09 编辑

今天分享一个计算流体动力学开源软件OpenFOAM的测试案例,这个案例出自于cfd中文网,两年前的旧案例了,不过可以做作为并行算力测试的benchmark。原贴子:https://www.cfd-china.com/topic/3988/200万网格并行算力测试-openfoam版本。

案例分享:cloud.189.cn/web/share?code=67VzieMvYz2m(访问码:41fk)

这个测试案例比较专业,需要编译openfoam,搞流体的看官可以测测。我用13900k测试出来的结果有点奇怪。mpirun调用8核时,计算结果是最快的,只需要106.23s。

三种可能,1.我的测试有问题;2.算例压力太小,通常来说,数值计算确实不是核心越多算得越快,还需要匹配内存带宽;3.-np 8是只调用了大核心,超过后,比如-np 10,就会调用8大核心,2小核心。也有可能是小核心在计算中拖后腿了,如果是这样,7000锐龙全大核心搞计算,应该会更快??

这个案例有空还值得在研究下,比如强制对进程绑核,不知道会不会更快些。





2022-11-21_09-33.png
发表于 2022-11-21 11:31 来自手机 | 显示全部楼层
HyperSPH 发表于 2022-11-20 21:39
楼主想法很不错,但是举手的不会多,cfd-online的硬件版块评测也不过如此。一方面门槛高,另一方面代码采用 ...

不想参与也请别泼冷水。我刚好就是有这方面需求的。5楼那个链接已经确定13代和zen4 编译速度比我正在用的zen3快很多了。但是那个链接缺失了13700k。

你说门槛高,本来就没指望单纯游戏玩家贡献信息,那么抛开这类用户,只要平时用到gcc make这类工具的人几乎就是0门槛。git pull 一下,make一下,要什么门槛?

你在这泼冷水打消提供信息人的积极性,你是什么成分?就为了秀你见多识广?
发表于 2022-11-21 11:34 | 显示全部楼层
leverkusen 发表于 2022-11-21 11:31
不想参与也请别泼冷水。我刚好就是有这方面需求的。5楼那个链接已经确定13代和zen4 编译速度比我正在用的 ...

淡定没必要上升到什么成分的高度吧?第一句话就已经肯定了楼主的做法了。他是做CFD,同行善意提醒下罢了~
发表于 2022-11-21 11:40 | 显示全部楼层
aasa0001 发表于 2022-11-21 02:23
企业采购的服务器往往是渣渣,被ws秒杀,甚至不如msdt都很正常。

往往。。。
不同场景其实差别很大,无脑踩吹图啥。。。
企业又不傻
发表于 2022-11-21 13:02 | 显示全部楼层
本帖最后由 zhuifeng88 于 2022-11-21 19:53 编辑
coooool_boy 发表于 2022-11-21 10:07
今天分享一个计算流体动力学开源软件OpenFOAM的测试案例,这个案例出自于cfd中文网,两年前的旧案例了,不 ...


这事情amd的多ccx也一样的
5950x, openfoam10, openmpi, ubuntu, 跨ccx的时候会伴随一个大幅度的性能损失, 这不是大核不大核的问题

Run for core_12...
  decomposePar for core_12...
  solving for core_12...
Run for core_10...
  decomposePar for core_10...
  solving for core_10...
Run for core_8...
  decomposePar for core_8...
  solving for core_8...
# cores   Wall time (s):
------------------------
12 270.38
10 358.858
8 266.196
发表于 2022-11-21 13:53 来自手机 | 显示全部楼层
还是应该鼓励一下的,不是每人都便携机来剪视频的。
用gcc做测试的话,内存的因素需要避免被放大。
发表于 2022-11-21 13:55 | 显示全部楼层
支持下楼主!
发表于 2022-11-21 15:15 | 显示全部楼层
hoffman 发表于 2022-11-20 22:49
关注,有没有matlab的测试,科研狗主要用这个

https://t.bilibili.com/730471566681309270
随手转个,不过没版本号。
发表于 2022-11-21 15:29 | 显示全部楼层
hoffman 发表于 2022-11-20 22:49
关注,有没有matlab的测试,科研狗主要用这个

https://www.bilibili.com/video/BV14G411L7g6
6分钟,一堆“冷门”“生产力软件”里面有matlab,还有2个版本的测试结果
发表于 2022-11-21 17:59 | 显示全部楼层
dadaxiya 发表于 2022-11-21 11:40
往往。。。
不同场景其实差别很大,无脑踩吹图啥。。。
企业又不傻

制定采购规则的往往都是傻子或者官僚主义者
发表于 2022-11-23 03:23 | 显示全部楼层
生产力软件有很多种
大部分是 “解除功耗限制”的13900K小赢 (也就是全P核至少稳定5.5Ghz)
少部分是7950X小赢

备注1 : 如果大小核调度有问题, 就用process lasso强制调用核心
备注2 : 7950X官方支持内存频率5200 mhz / 13900K 官方支持内存频率5600 mhz, 所以用7950X + DDR5 6000 CL30 vs 13900K + DDR 5 6400 CL32是合理的
发表于 2022-11-23 03:41 | 显示全部楼层
Linux 内核编译可以用 make allmodconfig,这样会编译内核当中所有的模块,工作量更大。
发表于 2022-11-23 08:08 | 显示全部楼层
我有个5950x,但是没intel测不了

我就是典型跑仿真运算的
 楼主| 发表于 2022-11-23 12:10 | 显示全部楼层
roychan 发表于 2022-11-23 03:41
Linux 内核编译可以用 make allmodconfig,这样会编译内核当中所有的模块,工作量更大。 ...

早上抽空又编译了下,平台:linux内核6.0.9,13900k + 海力士adie 32x2,7000hz,cpu设置默认。
make allmodconfig生成配置文件,time make -j32,需要时间8分55秒;
make allyesconfig生成配置文件,time make -j32,需要时间10分02秒;

make allmodconfig

make allmodconfig

make allyesconfig

make allyesconfig
发表于 2022-11-23 14:24 | 显示全部楼层
看到了这里的编译测试,Intel要快一点点不过amd确实要省电一些。https://www.phoronix.com/review/intel-core-i9-13900k/2
发表于 2022-12-7 09:08 | 显示全部楼层
zhuifeng88 发表于 2022-11-21 13:02
这事情amd的多ccx也一样的
5950x, openfoam10, openmpi, ubuntu, 跨ccx的时候会伴随一个大幅度的性能损失 ...

最近在飞腾 CPU 上面作开发
64 核心,8 个 NUMA
垮 NUMA 的性能损失非常明显
相比之下,x86 的损失好太多了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-1-16 00:50 , Processed in 0.012438 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表