SPR的硬件加速器官方Demo

埃律西昂 · 发表于 2022-9-29 10:38

https://www.anandtech.com/show/1 ... -at-innovation-2022

有点太模糊了，一下子看不清楚。

momo77989724 · 发表于 2022-9-29 10:41

那么今年上不上HEDT。。。

埃律西昂 · 发表于 2022-9-29 10:42

momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。

今年基本不可能，Innovation是最后的大发布会了，要上也是CES 2023

人撞猪上 · 发表于 2022-9-29 10:54

翻译其中一段：
“此处使用单个 CPU 内核来展示效率（并且因为几个 CPU 内核就足以使链路饱和），与仅使用英特尔优化的 DSA 模块相比，DSA 模块允许 Sapphire Rapids 在 128K QD64 顺序读取上提供 76% 以上的 IOPS相同工作负载上的 ISA-L 库。 EPYC 系统的领先优势更大，DSA 的延迟远低于 2000us。

还使用较小的 16K QD256 随机读取进行了类似的测试，针对 2 个 CPU 内核运行。 DSA 的性能优势在这里并没有那么大——与 Sapphire Rapids 上的优化软件相比只有 22%——但与 EPYC 相比，优势再次更大，延迟更低。”

看来这货出来以后， AMD就会彻底失去最后的遮羞布了，春秋大梦醒后，还是回去专注与属于自己的低端低价市场吧

847681220 · 发表于 2022-9-29 11:16

人撞猪上发表于 2022-9-29 10:54
翻译其中一段：
“此处使用单个 CPU 内核来展示效率（并且因为几个 CPU 内核就足以使链路饱和），与仅使用 ...

mi300也有封装fpga或asic版本啊

Xerxes2 · 发表于 2022-9-29 11:30

人撞猪上发表于 2022-9-29 10:54
翻译其中一段：
“此处使用单个 CPU 内核来展示效率（并且因为几个 CPU 内核就足以使链路饱和），与仅使用 ...

如果没加你的私货，看起来还是蛮正常的一个人，可惜了

qh88511 · 发表于 2022-9-30 09:38

如果INTEL的新HEDT平台出来了，旗舰CPU的价格应该会比10980xe价格要高吧？？

aasa0001 · 发表于 2022-10-1 01:27

hedt版本估计把这些都阉割了。
amx和avx512还是很有用，阉了就很鸡肋。剩下的确实WS很难用到。

aibo · 发表于 2022-10-1 01:30

qh88511 发表于 2022-9-30 09:38
如果INTEL的新HEDT平台出来了，旗舰CPU的价格应该会比10980xe价格要高吧？？

10980已经是菜鸡了，7980才是巅峰。
不过如果以后还有hedt，超7980应该是小意思

赫敏 · 发表于 2022-10-1 03:03

怪不得拖了这么久，原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设计的CPU。里面网络加速单元，nvme OF加速单元都是给AWS成品服务设计的。只可惜AWS不一定有兴趣，在搞自己的一套arm，可能微软azure会有兴趣搞这些。一般的公司没必要也没精力搞

赫敏 · 发表于 2022-10-1 03:04

当然传统CPU算力明显是寄了，跟zen3比才领先这么点。把zen3提到SPR同功耗水平应该直接反杀了

赫敏 · 发表于 2022-10-1 03:05

aasa0001 发表于 2022-9-30 12:27
hedt版本估计把这些都阉割了。
amx和avx512还是很有用，阉了就很鸡肋。剩下的确实WS很难用到。 ...

你去看看amx现在才几条指令，连个加法都没有。现在就起个名字把坑占住而已

赫敏 · 发表于 2022-10-1 03:08

847681220 发表于 2022-9-28 22:16
mi300也有封装fpga或asic版本啊

CPU直接集成这些还是有优势，不用来回倒数据。外挂ASIC可能算力过剩IO跟不上

用户 · 发表于 2022-10-1 04:26

赫敏发表于 2022-10-1 03:03
怪不得拖了这么久，原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...

微软看x3d那一波，看着已经all in amd了吧

用户 · 发表于 2022-10-1 04:28

赫敏发表于 2022-10-1 03:05
你去看看amx现在才几条指令，连个加法都没有。现在就起个名字把坑占住而已 ...

amx加法和avx有区别吗

tudou02 · 发表于 2022-10-1 09:56

momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。

买WORKSTATION呗

HEDT怕是不会再有

ternnence@chh · 发表于 2022-10-1 12:03

用户发表于 2022-10-1 04:28
amx加法和avx有区别吗

如果有的话，估计就是同时操作的数据不一样吧。amx都是int8的，而且宽度也比avx512宽。amx的寄存器是二维矩阵形式的。avx都是向量。

ternnence@chh · 发表于 2022-10-1 12:08

赫敏发表于 2022-10-1 03:08
CPU直接集成这些还是有优势，不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

dsa有三种模式:协处理器，集成在cpu但走pcie，插在主板上。

各有优势，看使用场景了。

有些巧合的是，via之前发布的cna处理器和intel这个一样都是第二种。而且via那个团队被intel买走了。估计是集中了相关的人才。

ternnence@chh · 发表于 2022-10-1 12:11

赫敏发表于 2022-10-1 03:08
CPU直接集成这些还是有优势，不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

外挂加速器走的就是offload路线，就像显卡一样，任务全包，板载显存，自带dma可以访问内存。gpu收到的任务基本不需要cpu就可以全部做完了。其实也没有什么问题。

不过intel不会走这个路线就是了。

ternnence@chh · 发表于 2022-10-1 12:14

现在各大数据中心厂商基本自研npu（网络加速器），就是走的外接设备路线。所有计算都offload，包括openssl这些。和cpu基本没关系。cpu的作用就是协调管理。

当然，更有想法的就买arm授权自己做集成在cpu的dsa，比如aws和阿里。

a6057c · 发表于 2022-10-1 12:26

赫敏发表于 2022-10-1 03:03
怪不得拖了这么久，原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...

亚马逊有自己的Nitro加速卡根本瞧不上这些CPU内置的东西，迭代慢还卖的贵。微软也有类似的。

momo77989724 · 发表于 2022-10-1 12:58

tudou02 发表于 2022-10-1 09:56
买WORKSTATION呗HEDT怕是不会再有

也不是工作用就是看看自己组个玩如果价格不离谱的话有时候过段日子又改注意了

chenwen834 · 发表于 2022-10-1 13:07

赫敏发表于 2022-10-1 03:08
CPU直接集成这些还是有优势，不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

有没有一种可能，MI300是超级APU

kaiwenwu · 发表于 2022-10-1 14:24

Xerxes2 发表于 2022-9-29 11:30
如果没加你的私货，看起来还是蛮正常的一个人，可惜了

就算当前产品，epyc也不行啊，intel的指令集优势很大，epyc现在也就在一些不依赖指令集支持的应用里比较有优势，比如储存，渲染这种纯算力场景

gtx9 · 发表于 2022-10-1 14:35

kaiwenwu 发表于 2022-10-1 14:24
就算当前产品，epyc也不行啊，intel的指令集优势很大，epyc现在也就在一些不依赖指令集支持的应用里比较 ...

Intel也不敢说你这话

kaiwenwu · 发表于 2022-10-1 15:11

gtx9 发表于 2022-10-1 14:35
Intel也不敢说你这话

这个也不是我说的，intel自己说的

账号		自动登录	找回密码
密码			加入我们

[CPU] SPR的硬件加速器官方Demo