V100训练初体验【VS 3090】
-
今天平台里上新了V100的服务器,为了尝尝鲜,于是乎我决定在V100上训练一个文本分类任务。
配置信息对比
配置 3090 V100 价格 4.5(可使用代金券) 5.5(不可使用代金券) 内存 64G / GPU 64G / GPU CPU 8核 / GPU 8核 / GPU 网络 下行带宽:50MB/s 下行带宽:10MB/s 显存 24 GB 32GB 硬盘 1.6T SSD 800.0G HDD 有无nas 有 无 可以发现V100虽然显存比3090大,但是性价比不如3090高(不可使用代金券,下行速度慢,硬盘不是SSD,没有Nas)。
V100 训练(使用fp16)
可以看到训练batch size 能调到32,此时使用率将近100%
RTX3090 训练(使用fp16)
而3090,batch size则不能调到32,会出现OOM,只能调到24,使用率也将近100%
结果对比
3090 V100 训练时间 39m38s 35m20s accuracy 64.39 68.61 Tips:
这是个不严谨的测试。请自行判断结果是否可信。