|
本帖最后由 netjunegg 于 2024-12-1 12:13 编辑
手头有个游戏本是4060m显卡, 和mac mini4跑同样的大模型进行对比
同样用ollama跑qwen2.5:7b, 本以为mini 4的速度会明显慢, 谁知道并不慢, 反倒比4060m快50%
同样从0开始启动, 两边一模一样的提示词, 用go语言生成websocket客户端和服务端示例
mini 4总共耗时46秒, 4060m总共耗时70秒, 计时误差不超过2秒, 挺出乎意料的.
看了下两边数据都是百分百在gpu中, 显存占用6G多点.
另外试了下, mini4可以跑qwen2.5:14b, 显存占用10G多点, 这个4060m就无能为力了.
如果确实如此的话, 我感觉mini4挺值, 有点后悔没买pro加大内存的了, 不知道pro跑更大的模型效果怎么样
有没有小伙伴能做下类似的测试? 看跟我的结果是否一样?
---------------- 更新, 反转:
重启4060m的系统后, 再次测试4060m, 发现速度提高了非常多, 又大幅超越mini4, 领先一半以上, 无语了, 这个倒是比较符合预期
之前测试的时候已经重启过ollama服务端和客户端, 看来跟重启系统效果还是大不一样, 有点玄学, 难道系统运行久了就慢?
|
|