找回密码
 加入我们
搜索
      
查看: 6780|回复: 25

[CPU] SPR的硬件加速器官方Demo

[复制链接]
发表于 2022-9-29 10:38 | 显示全部楼层 |阅读模式
https://www.anandtech.com/show/1 ... -at-innovation-2022

有点太模糊了,一下子看不清楚。
发表于 2022-9-29 10:41 | 显示全部楼层
那么今年上不上HEDT。。。
 楼主| 发表于 2022-9-29 10:42 | 显示全部楼层
momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。


今年基本不可能,Innovation是最后的大发布会了,要上也是CES 2023
发表于 2022-9-29 10:54 | 显示全部楼层
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用英特尔优化的 DSA 模块相比,DSA 模块允许 Sapphire Rapids 在 128K QD64 顺序读取上提供 76% 以上的 IOPS相同工作负载上的 ISA-L 库。 EPYC 系统的领先优势更大,DSA 的延迟远低于 2000us。

还使用较小的 16K QD256 随机读取进行了类似的测试,针对 2 个 CPU 内核运行。 DSA 的性能优势在这里并没有那么大——与 Sapphire Rapids 上的优化软件相比只有 22%——但与 EPYC 相比,优势再次更大,延迟更低。”

看来这货出来以后, AMD就会彻底失去最后的遮羞布了,春秋大梦醒后,还是回去专注与属于自己的低端低价市场吧
发表于 2022-9-29 11:16 来自手机 | 显示全部楼层
人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...

mi300也有封装fpga或asic版本啊
发表于 2022-9-29 11:30 | 显示全部楼层
人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...

如果没加你的私货,看起来还是蛮正常的一个人,可惜了
发表于 2022-9-30 09:38 | 显示全部楼层
如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧??
发表于 2022-10-1 01:27 | 显示全部楼层
hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。
发表于 2022-10-1 01:30 | 显示全部楼层
qh88511 发表于 2022-9-30 09:38
如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧??

10980已经是菜鸡了,7980才是巅峰。
不过如果以后还有hedt,超7980应该是小意思
发表于 2022-10-1 03:03 来自手机 | 显示全部楼层
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设计的CPU。里面网络加速单元,nvme OF加速单元都是给AWS成品服务设计的。只可惜AWS不一定有兴趣,在搞自己的一套arm,可能微软azure会有兴趣搞这些。一般的公司没必要也没精力搞
发表于 2022-10-1 03:04 来自手机 | 显示全部楼层
当然传统CPU算力明显是寄了,跟zen3比才领先这么点。把zen3提到SPR同功耗水平应该直接反杀了
发表于 2022-10-1 03:05 来自手机 | 显示全部楼层
aasa0001 发表于 2022-9-30 12:27
hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。 ...

你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已
发表于 2022-10-1 03:08 来自手机 | 显示全部楼层
847681220 发表于 2022-9-28 22:16
mi300也有封装fpga或asic版本啊

CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上
发表于 2022-10-1 04:26 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...

微软看x3d那一波,看着已经all in amd了吧
发表于 2022-10-1 04:28 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:05
你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已 ...

amx加法和avx有区别吗
发表于 2022-10-1 09:56 | 显示全部楼层
momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。

买WORKSTATION呗HEDT怕是不会再有
发表于 2022-10-1 12:03 来自手机 | 显示全部楼层
用户 发表于 2022-10-1 04:28
amx加法和avx有区别吗

如果有的话,估计就是同时操作的数据不一样吧。amx都是int8的,而且宽度也比avx512宽。amx的寄存器是二维矩阵形式的。avx都是向量。
发表于 2022-10-1 12:08 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

dsa有三种模式:协处理器,集成在cpu但走pcie,插在主板上。

各有优势,看使用场景了。

有些巧合的是,via之前发布的cna处理器和intel这个一样都是第二种。而且via那个团队被intel买走了。估计是集中了相关的人才。
发表于 2022-10-1 12:11 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

外挂加速器走的就是offload路线,就像显卡一样,任务全包,板载显存,自带dma可以访问内存。gpu收到的任务基本不需要cpu就可以全部做完了。其实也没有什么问题。

不过intel不会走这个路线就是了。
发表于 2022-10-1 12:14 来自手机 | 显示全部楼层
现在各大数据中心厂商基本自研npu(网络加速器),就是走的外接设备路线。所有计算都offload,包括openssl这些。和cpu基本没关系。cpu的作用就是协调管理。

当然,更有想法的就买arm授权自己做集成在cpu的dsa,比如aws和阿里。
发表于 2022-10-1 12:26 | 显示全部楼层
赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...


亚马逊有自己的Nitro加速卡根本瞧不上这些CPU内置的东西,迭代慢还卖的贵。微软也有类似的。
发表于 2022-10-1 12:58 | 显示全部楼层
tudou02 发表于 2022-10-1 09:56
买WORKSTATION呗HEDT怕是不会再有

也不是工作用  就是看看自己组个玩 如果价格不离谱的话  有时候过段日子 又改注意了
发表于 2022-10-1 13:07 | 显示全部楼层
赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

有没有一种可能,MI300是超级APU  
发表于 2022-10-1 14:24 | 显示全部楼层
Xerxes2 发表于 2022-9-29 11:30
如果没加你的私货,看起来还是蛮正常的一个人,可惜了

就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较有优势,比如储存,渲染这种纯算力场景
发表于 2022-10-1 14:35 来自手机 | 显示全部楼层
kaiwenwu 发表于 2022-10-1 14:24
就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较 ...

Intel也不敢说你这话
发表于 2022-10-1 15:11 | 显示全部楼层
gtx9 发表于 2022-10-1 14:35
Intel也不敢说你这话

这个也不是我说的,intel自己说的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-9-22 13:39 , Processed in 0.012251 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表