可以用Geforce代替Tesla来做深度学习吗?

  • 未知
  • 2021-10-26 11:56:40

产业数字化转型浪潮迭起,各行各业都需要建立与自身商业模式适配的AI大脑,实现智慧经营、智能决策。那么可以用Geforce代替Tesla来做深度学习吗?毕竟价格上Geforce便宜太多了。

众所周知,英伟达是显卡界的老大,2017年英伟达的GPU芯片在全球市场的占有率为70%左右,无论是人工智能、自动驾驶,甚至搞电竞、区块链都绕不开英伟达的阴影。Tesla系类的价格是GeForce价格的数倍,所以现在不少厂商都是在用GeForce进行深度学习运算。

image.png

Geforce代替Tesla做深度学习理论上是可以的

有人专门做了对比,统计Geforce和Tesla显卡两者训练的平均时间,虽然Tesla在标准测试中胜过了GeForce(但价格也摆在那),但是,也只获得了1.25倍的加速,或者说,Tesla 系列显示卡进行深度学习的训练时间,相较 GeForce 系列显示卡少了 20%,整体差距不是很大,但是价格方面,Tesla是GeForce却是天上地下,足有数倍差距,所以综合来看,GeForce无疑是性价比最佳的解决方案。

英伟达最初开发GPU是用于游戏的,产品线包括针对游戏的GeForce系列和用于高端处理器的Tesla系列。一组简单的数字:

GeForce GTX 1080: PASCAL; 2560 CUDA cores; 8 TFLOPS (single-prec); 8 GB GDDRX5 320 GB/s; max 180 W.

Tesla P100: PASCAL; 3584 CUDA cores; 9.3 TFLOPS (single-prec); 16 GB HBM2 732 GB/s; max 250 W.

这样看不直观。有人专门做了对比[2],下图展示了训练的平均时间。Tesla在基准测试中胜过了GeForce;但是,只有1.25倍的加速(或者说,训练时间减少了20%)。在MNIST基准上看,差异并不明显,可能是由于epoch速度太快。

image.png

英伟达禁止Geforce用于深度学习

2017年英伟达悄然修改了用户许可协议,其中特别要求消费者级显卡GeForce允许做区块链处理,但禁止在数据中心使用GeForce显卡做深度学习。

GeForce、Quadro与Tesla三款产品中最物美价廉的就是GeForce系列产品,它不仅仅只用于打游戏,性能上与其他两类产品区别不大,有些服务器企业处于成本的考虑,会大量使用GeFoce显卡,尽管Tesla是服务器专用的 GPU加速器,但8-10倍的价格差距,使得很多服务器和专注深度学习的企业宁愿选择GeForce显卡。

此次英伟达的禁令,就是明确划分旗下产品的边界,说得通俗一些,Geforce系列的GPU芯片就是用来打游戏的,如果想建数据中心,并且搞挖矿以外的事情的话,请买别的产品。这对于那些财大气粗的巨头企业来说也许影响不大,但对于中小机构或是个人开发者而言,相当于变相提高了深度学习的门槛。

那还可以把Geforce用在数据中心吗?

准确的说不是不允许在数据中心使用GeForce显卡,而是禁止在数据中心授权配套软件,换句话说就是,你还是可以正常买显卡,但是没有英伟达官方的软件许可,使用 GeForce 进行深度学习训练是几乎无法进行的。修改后的英伟达GeForce软件用户使用协议,No Datacenter Deployment,软件不能在数据中心使用。

不过很多人解读是NVIDIA 在限制 GeForce 显卡进行深度学习。这一推断其实也是合理的,毕竟数据中心内部署显卡很少是用来玩游戏的。

Copyright 2020-2025