显卡算力这个词是不是和挖X一起被炒起来的啊记得以前都是跑分没人提算力啊 - 第2页 - 电脑讨论(新) - Chiphell - 分享与交流用户体验

牧羊的猫 发表于 2024-9-13 00:37

以后都要用上ai pc了，到时算力应该是个重要指标吧

Xp47 发表于 2024-9-13 00:49

这个算力是computing power还是processing power哦，一开始“X computer” （X=K P E...）好像用的是processing power

panzerlied 发表于 2024-9-13 01:27

这楼主总是有些那么无法形容的言论……

BFG9K 发表于 2024-9-13 01:36

panzerlied 发表于 2024-9-13 01:27
这楼主总是有些那么无法形容的言论……

LZ是到处质疑PS5PRO规格的出处，脸被打肿了搁这儿自己找台阶下呢

Neo_Granzon 发表于 2024-9-13 07:38

叶子烟发表于 2024-9-12 18:19
你要提跑分，那I卡你买吗

扎心了,I卡纸面算力也高的,MTT也类似.

Penguindad 发表于 2024-9-13 08:23

算力是显卡硬件设计决定的，大致就是规模*频率*IPC这样，跑分是运行类似一个定制的游戏帧数换算出来的，所以对于打游戏的而言，参考性：具体游戏实测帧数>跑分>算力

jxljk 发表于 2024-9-13 09:04

叶子烟发表于 2024-9-12 18:19
你要提跑分，那I卡你买吗

意思跑分也不能真正体现显卡的能力吗？高分低能？

jxljk 发表于 2024-9-13 09:08

Neo_Granzon 发表于 2024-9-13 07:38
扎心了,I卡纸面算力也高的,MTT也类似.

算力如果不能体现游戏性能的话那算力高的那种挖X是不是真能真正能体现性能还是算力高也不一定挖X就是牛？

jxljk 发表于 2024-9-13 09:09

Penguindad 发表于 2024-9-13 08:23
算力是显卡硬件设计决定的，大致就是规模*频率*IPC这样，跑分是运行类似一个定制的游戏帧数换算出来的，所 ...

所以显卡真正的实力还是需要看游戏实际测试什么跑分算力只是一个参考是吧

jxljk 发表于 2024-9-13 09:11

在补充一下问题我记得很早之前是A卡7970时代的时候媒体评测好像提过一嘴双精度运算还是单精度运算但是绝对没说过算力

nekotheo 发表于 2024-9-13 09:17

本帖最后由 nekotheo 于 2024-9-13 09:18 编辑

以前很少用算力这个词，这个词都是日本人以及深度阿宅在用（后者因为接触日本文化很多），但不是不在意这个，只是换了个称呼，浮点运算能力（一般指的是单精度，有时候就简称FP32了），运算能力简称算力吧也没毛病，只是一般不用简称，懒得打字直接FP32了。

这个阶段里，衡量显卡性能的主要就看FP32（因为我们臭打游戏的跟这个关系最大），要干活的还会看FP64（但这个群体在DIYer社区里就会少一些），所以要么不提，要么就提FP32或FP64，衡量标准比较少。楼主所说的跑分，可以理解为衡量显卡在这方面的能力。

后来随着炼丹的出现，FP16等也出现在了官方的表格里，再往后就是挖矿，出了一个Hash Rate，再到现在AI，衡量显卡性能的参数越来越多，所以有时候就会统称为算力。

当然我本身不太接受这个词（“你不接受算什么？”），我还是更倾向于具体问题具体分析，算力一词过于笼统（键盘价值更高）。

PolyMorph 发表于 2024-9-13 09:23

jxljk 发表于 2024-9-13 09:09
所以显卡真正的实力还是需要看游戏实际测试什么跑分算力只是一个参考是吧 ...

应该看帧数和low帧

jxljk 发表于 2024-9-13 09:29

nekotheo 发表于 2024-9-13 09:17
以前很少用算力这个词，这个词都是日本人以及深度阿宅在用（后者因为接触日本文化很多），但不是不在意这个 ...

HD 7970 HD 6970 GTX 580
ComputeMark 3117 1493 1730
GPCBenchmarkOCL 6145.5 2223.3 3883.4
全局存储器 225.5 126.6 208.6
局部存储器 238.5 39.1 158.1
单精度浮点运算 377.9 123.6 187.4
双精度浮点运算 1056.8 0 257.2
常用数学方法（单精度） 563.1 422.8 965.3
常用数学方法（双精度） 1164.7 0 1401.6
图像处理 1573.7 889.9 417.9
密码学 945.2 621.3 287.2

以前有过测试但是绝对不是评测显卡游戏性能的标准也没有笼统的算力说法而是具体的项目

ttt5t5t 发表于 2024-9-13 09:35

上世纪末詹姆斯卡梅隆的终结者里面就提到运算能力了单位是TFlops
还是老电影看少了

谎言之神Cyric 发表于 2024-9-13 09:48

我焯，太后现代脑残了[雷人]

LOLI反应堆 发表于 2024-9-13 10:19

Penguindad 发表于 2024-9-13 08:23
算力是显卡硬件设计决定的，大致就是规模*频率*IPC这样，跑分是运行类似一个定制的游戏帧数换算出来的，所 ...

算力不乘以IPC，什麽架构都是规模*频率。

NiseKoi偽戀、 发表于 2024-9-13 10:27

本帖最后由 NiseKoi偽戀、于 2024-9-13 10:32 编辑

想當年初代泰坦沒砍雙精度1570 GFLOPS (算力是單精度1/3)，FP64算力比4090都強[偷笑]
後者1290 GFLOPS(算力是單精度1/64)

jxljk 发表于 2024-9-13 10:31

NiseKoi偽戀、发表于 2024-9-13 10:27
想當年初代泰坦沒砍雙精度，FP64算力比現今4090還強

泰坦说白了就是计算卡不是游戏卡回顾了一下发现老黄其实从开普勒开始就开始砍了把显卡分为游戏卡与计算卡转了一圈又回来了发现有些地方还是需要双精度[傻笑]

welsmann 发表于 2024-9-13 10:41

本帖最后由 welsmann 于 2024-9-13 10:44 编辑

说到这个总是让我想起现在的各类NPU，XPU芯片的算力，天天嘴上挂着XXXTOPs，这个TOPs是FP32？FP16？FP8？INT8?INT4？

关键是这些NPU都不敢亮血条来batte一下，不如GPGPU实在，

要说AI运算，那黄伟达的芯片一开稀疏矩阵跑起tensor直接就起飞了，

带了tensor的FP8加上稀疏矩阵的4090默频都能到1.320PFlops（我记得应该是NV的ada架构白皮书里这么写的https://images.nvidia.cn/aem-dam/Solutions/geforce/ada/nvidia-ada-gpu-architecture.pdf）

又：4090可以超，小飞机一拉超到3.06GHz可以去看AIDA64里面（位置大概在GPGPU）有个理论性能计算页面，FP32都被干到100Tflops了，你细品，什么tensor FP8，估计按照白皮书的换算法，估计都有小800T了（上稀疏矩阵估计1.4~1.5P应该有的）。

更别提帕斯卡以来就有的INT4，那都不敢想，如果按照现在这种文字游戏TOP算力（跑的最快的数据格式，tensor INT4稀疏矩阵），默频估计有2PTOPs多，超了可能有3PTOPs。然而有些芯片没那个逻辑电路，就跟1080跑FP16一样，慢悠悠的，NPU呢？FP8估计也不行。所以这种算力就是个伪命题，最好都先实锤硬件上原生支持哪些数据格式，再归一化（比如说喜闻乐见的FP32）亮血条了比

晓古城 发表于 2024-9-13 10:43

我只看基础性能，皮衣黄连显存都不想给。纯游戏党买感觉老亏，不能玩高分辨率

jxljk 发表于 2024-9-13 10:44

welsmann 发表于 2024-9-13 10:41
说到这个总是让我想起现在的各类NPU，XPU芯片的算力，天天嘴上挂着XXXTOPs，这个TOPs是FP32？FP16？FP8？IN ...

很久以前都是单双精度老黄把双精度给砍了现在我好奇 RTX 这个tensor是什么运算[可爱]

Epilogue 发表于 2024-9-13 10:46

挺抽象的，现在说的ai算力都说的fp8，还有下一代的fp4，还有人在纠结fp64，搞的像近几年没上过网一样。

welsmann 发表于 2024-9-13 10:48

本帖最后由 welsmann 于 2024-9-13 10:49 编辑

jxljk 发表于 2024-9-13 10:44
很久以前都是单双精度老黄把双精度给砍了现在我好奇 RTX 这个tensor是什么运算 ...

有个tensorcore，https://images.nvidia.cn/aem-dam/Solutions/geforce/ada/nvidia-ada-gpu-architecture.pdf里面有讲，再每一组里面有一个tensorcore单元，他的功能是每次CUDA跑AI的时候就会介入，数据进去会被加速运算。配合外面普通的单精度FP/INT SM流处理器协同计算就能实现混合精度运算比单纯的单精度/INT32运算单元要快很多

你可以认为tensor FP32 /ten sor FP16 tensor xx 是老黄针对CUDA架构进行优化的数据格式，能够榨干CUDA GPU性能

Epilogue 发表于 2024-9-13 10:48

panzerlied 发表于 2024-9-13 01:27
这楼主总是有些那么无法形容的言论……

有一种活在10年前的美，严重脱离时代的感觉。

icedew0912 发表于 2024-9-13 11:39

jxljk 发表于 2024-9-12 22:50
我就说吗之前都是3dmark多少分从来没说过多少算力话说现在测试显卡有测算力这一环的吗 ...

算力这个概念类似100米赛跑,400米跑是单项的(主流是fp32算力,也有fp16算力)
跑分是各种项目加权,3dmark等跑分就是铁人三项这类,一个分是100米,400米,铁饼等各个项目都比一下然后加在一起(各跑分软件选的项目不一样)
而帧数就像足球篮球这样综合项目,驱动总线影响很大的.
所以现在ai受重视就是看单项所以是算力（铁饼分如硬解视频不看了），以前看跑分这种综合评价（如可以内置硬解视频就可以既省成本分又高很多）但实际游戏像足球不光看运动员身体素质，技术不行抢不到球（英特尔及国产显卡驱动）发挥不了也不行。

叶子烟 发表于 2024-9-13 11:45

jxljk 发表于 2024-9-13 09:04
意思跑分也不能真正体现显卡的能力吗？高分低能？

看实际应用表现吧

swwbtk 发表于 2024-9-13 13:34

我这卡96CU                         =我这车8缸
我这卡算力XXXX                   =我这车620马力
我这卡timespy跑分XXXX    =我这车百公里加速3.4秒
我这卡XX游戏帧数 XXX以上 =我这车纽北7分04秒

但是这几个数据不是正相关，缸多的不一定马力大，马力大的不一定跑得快，跑的快的不一定刷圈快
根据自己的需求选择是看哪个数据作为参考

rainbow2003 发表于 2024-9-13 13:48

top500一直在用啊。。。
https://www.top500.org/lists/top500/2024/06/

fengpc 发表于 2024-9-13 14:08

落寞之心发表于 2024-9-12 22:55
打游戏看跑分更贴近实际一些，实际上还是得看实际游戏的平均桢。
算力跟矿和AI关系更大，像30系的LHR显卡、 ...

限制挖矿算力不等于限制AI算力，LHR显卡限制挖矿算力是通过限制某些挖矿常用但是别的运算少用的算子（例如桶形移位运算）速度实现的，其实Maxwell之前gpu桶形移位速度是限得很低的只有tesla卡才开放，后来发现对挖矿提高很大又给geforce开放了;
游戏跑分受前端几何引擎、shader/cuda core的算力（单精度）和光栅化各个单元的速度影响，所谓的限制算力对游戏没多少影响;
现在AI运算既可以用cuda core跑（稠密算力），也可以用tensor core（稀疏算力）跑，tensor core实际运行速度受运算数据影响比较大（0数据自动跳过不运算）标称值非常高实际上是比较虚的，美国禁运之后nv的解决方案就是砍tensor core单元，让gpu的纸面参数大打折扣，其实用户要用的该买的还是会买nv的卡实际影响没那么大，国内自媒体净瞎说买阉割卡的人是腰杆挺不直其实自己屁都不懂

Neo_Granzon 发表于 2024-9-13 15:22

NiseKoi偽戀、发表于 2024-9-13 10:27
想當年初代泰坦沒砍雙精度1570 GFLOPS (算力是單精度1/3)，FP64算力比4090都強
後者1290 GFLOPS(算力是單精 ...

CUDA双精度算力在家用真的纯电阻丝，一丁点用处都没有的。

页: 1 [2] 3

Chiphell - 分享与交流用户体验's Archiver