这个问题,我们十几年前就开始讨论了……至少现在来说,我们码农,还是觉得 GPU 不方便(没有内存统一寻址 ...
有没有可能把这些优化代码的工作交给AI,生成适合GPU执行的代码? 不能。GPU核心多就意味着每个功能都简单。没有专用指令集,靠软件编程,一条指令变成几十条指令,效率极其低下。 gihu 发表于 2024-11-22 13:17
有没有可能把这些优化代码的工作交给AI,生成适合GPU执行的代码?
目前还不能,会乱来的。。。AI目前搞出来的代码,适合简单的片段,或者学生完成作业demo 可以参考苹果M4 apu 手机多合一soc或者 ps5 类似的方案。 有可能 但是你不能叫他GPU你得叫CPU 8owd8wan 发表于 2024-11-22 13:29
目前还不能,会乱来的。。。AI目前搞出来的代码,适合简单的片段,或者学生完成作业demo ...
好吧,看来离GAI还远呢[偷笑] 地球上哪有那么多可以并行的事情 没啥不可能的,现代gpu早就支持不同warp之间的异步编程了,只是有没有必要的问题罢了
只要你的科学计算工具使用了异构的计算库,那它就能够把计算代理给gpu做,这取决于这个科学计算工具有没有人维护,没人维护的就别想了,不可能自动异构的 xy. 发表于 2024-11-22 11:09
现代 x86 CPU 没有任何一颗是冯诺依曼结构
指令/数据 l1 分离, 属于哈佛结构;
哪条指令的数据先到位就执 ...
你在说黑盒里面的东西
指令数据统一编址
重命名支持下乱序执行会保证结果和顺序执行一致 AMD的融合方案
本帖最后由 我輩樹である 于 2024-11-22 17:53 编辑
现在不就是这样么?
还有相当一部分并行计算是由CPU进行的原因主要是三点,1,遗留代码(占99%的情况)。2,硬件成本,GPU是option不保证存在,开发者要考虑覆盖面。3,异构通讯也有额外成本,这个可以综合考虑再决定是否要进行GPU运算。苹果soc是最好的方式,就是成本高。
还有例如软件上的不值得去优化等非技术问题。
页:
1
[2]