admin 管理员组文章数量: 887019
随着新一代RTX 30系列GPU的火爆开售,近期很多人都在问什么样的CPU才能带的动RTX 3080甚至RTX 3090。那么这个带的动到底是什么意思呢?一般认为带得动就是不会给GPU制造瓶颈。接下来我们通过一系列评测看下比较适配的算力定制方案。
最新GPU深度学习性能排行
下图展示了当前热门的Nvidia GPU在深度学习方面的性能表现(以RTX 2080Ti为对比基准)。从图中可以看出,A100(40GB)在深度学习方面表现最为强劲,是RTX 2080 Ti 两倍还多;新出的RTX 3090(24GB)排第二,是RTX 2080 Ti 的1.5 倍左右。但比较良心的是,RTX 3090 的价格只涨了15%。
排在天梯图顶端的GPU确实是香,其次是性价比选择,建议依据各种任务的大致内存需求,结合上图进行细分筛选:
-
使用预训练 transformer 和从头训练小型 transformer:>= 11GB
-
训练大型 transformer 或卷积网络:>= 24 GB
-
原型神经网络(transformer 或卷积网络):>= 10 GB
-
Kaggle 比赛:>= 8 GB
-
应用计算机视觉:>= 10GB
高频CPU避免成为GPU瓶颈
CPU作为通用处理器需要计算电脑中的每一个细节,3D画面配合输出,单位运动轨迹计算,后台程序保持运行,还有音频、网络信号不断交换处理。
上图为主流CPU搭配RTX 3080在1080P下的测试数据,很明显,锐龙7 3800X或更低的CPU没有发挥出RTX 3080显卡的真正实力,也就是成了这套系统在1080P分辨率下的“瓶颈”。i9-9900K或锐龙7 3800XT及更高的CPU更适合RTX 3080组成系统。
再来看下3DMark理论性能测试,结合上图筛选,在测试中我们选择了Intel和AMD平台的最强的处理器锐龙9 3900X和i9-10900K。
总结一下,主要用1080P~2K分辨率的话,PCIe 3.0和4.0差别不大。4K起步的话,要想压榨出RTX 30的每一分能力,就真的应该考虑PCIe 4.0,还可以搭配最能发挥RTX IO功能的PCIe 4.0 SSD。
同时电源功率要够大,Nvidia官方给的信息是RTX 3070配650W,RTX 3080/3090配750W即可,但实际850W以上也挺好的。
定制RTX 30系列工作站
高校科研用户可领专属补贴
Cloudhin®云轩专注Deep learning和高性能计算服务器定制,针对主要深度学习框架(如TensorFlow、Caffe 2、Theano或Torch)进行了优化和设置,为计算系统提供强大的深度学习功能。
工作站CPU可选R7-3700X/R7-3800XT/R9-3900XT/R9-3950X等多线程处理器,7nm先进制程工艺,功耗更低,性能更强,频率更高,同步多任务更快速。支持更强PCIe 4.0接口,32GB/s带宽,数据传输更迅猛,扩展能力更强。
PCIe 4.0两倍于过去的CPU通信带宽,可以带来更好的GPU计算能力,NVIDIA新一代RTX 30系列GPU,全系支持PCIe 4.0 ,助力开发者们构建并加速HPC、基因组学、计算金融、数据科学、人工智能、影视后期等领域的应用。
专业勤修,锐意进取。云轩技术工程师毕业于NVIDIA深度学习研究所,丰富经验,值得信赖。更多定制方案请联系客服,我们将实时响应您的定制需求。
联系我们
如果您有合作需求或宝贵建议,欢迎来信。
邮箱:hezuo@kuanfans
合作热线:021-5415 5559
版权声明:本文标题:GPU必知 | 不为RTX 30设限,这般配置发挥每一分能力 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1725895687h888945.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论