admin 管理员组

文章数量: 887021

注:本文默认你已经安装好python,本文配置深度学习前的环境如下:

  • python3.6
  • win10 64位
  • GeForce GTX980Ti

1、安装CUDA

深度学习库如果使用CUDA进行GPU加速,可以大大缩短计算时间。

1.1 检查GPU是否支持CUDA

先确定下自己的显卡型号(不要告诉我你不知道怎么查看自己的显卡型号)。安装CUDA前先检查下,自己的显卡是否支持CUDA,可以从下面的网址查看自己的显卡是否在支持之列。
如果你的显卡比较新,到这里检查是否支持CUDA:https://developer.nvidia/cuda-gpus

如果你的显卡很老,请到如下链接检查是否支持CUDA:https://developer.nvidia/cuda-legacy-gpus

注意笔记本和desktop的区别。

刚开始我以为我机器的显卡不支持安装CUDA,检查后发现可以支持,计算性能5.2,感觉应该还可以,但肯定比不了GTX1080Ti的显卡,查了一下最新的显卡排行,如下图所示:

发现本机显卡只比GTX1070的显卡稍逊一点,居然还是高端显卡,训练个模型肯定不成问题了,就是时间稍慢一些。

1.2 下载CUDA

从CUDA官网选择对应系统下载并安装文件,地址:https://developer.nvidia/cuda-downloads?target_os=Windows

注意Installer Type选择exe(local)本地安装,exe(network)联网安装可能会发生各种问题,下载步骤如下图:

下载好后一路默认安装就好了。此处我安装的是CUDA9.2版本。

PS. 安装CUDA时想都没想就安装了最新版CUDA9.2,到最后才发现TensorFlow框架不支持9.2版本,目前支持最高版本为CUDA9.0,新手安装的时候直接安装9.0版本即可,下文会写我怎么解决的问题。

2、测试CUDA安装结果

打开命令提示符,输入:nvcc -V,可看到如下信息,代表安装成功。

3、下载cuDNN

安装好CUDA后其实已经可以使用GPU提速了,但cuDNN可以在前面GPU加速基础上大概再提升1.5倍的速度,它同样也是由NVIDIA开发。

cuDNN下载地址:https://developer.nvidia/rdp/cudnn-download

在下载cuDNN时,看其他博文说下载该文件需要在NVIDIA官网注册,我这里试了很久,都没有注册成功,不知道是因为官网出现了什么问题,还是国内的原因,我感觉是后者,总之没注册成功。

但遇到问题总需要解决,这里给没注册成功的朋友分享一个下载cuDNN的方法:

(1)打开cuDNN各个版本的下载网址:https://developer.nvidia/rdp/cudnn-archive#a-collapse51b

(2)然后选择你需要的版本,比方说选择cuDNN v7.0.5 Library for Windows 10,这里千万不要点击链接,否则会进入注册界面,而是右键选择“复制链接地址”

(3)打开迅雷等下载软件,添加任务将复制的链接地址输入进去,然后下载,下载速度还是比较快的

(4)下载后是一个压缩包,如果发现后缀名不是压缩包的格式,手动改一下

本文下载的是CUDA9.0对应的cuDNN7.0.5版本

4、配置cuDNN

下载好cuDNN后,解压cudnn-9.0-windows10-x64-v7.zip,把解压包中bin,include,lib里面的文件(共三个)分别拷贝到CUDA安装路径下的bin,include,lib目录下,即C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\下的bin,include,lib目录下即可。

5、安装深度学习框架

pip安装TensorFlow命令:pip install tensorflow-gpu

pip安装Keras命令:pip install keras

6、测试配置环境

在程序中输入import tensorflow as tf

测试一下tensorflow库是否安装成功,其他库类似。发现出错,如下图:

出现CUDA版本兼容错误,由于装的是最新版的CUDA,而tensorflow目前只支持到9.0版本,所以下载9.0版本的CUDA并安装:https://developer.nvidia/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
cuDNN重新配置对应版本。本文只重装了CUDA9.0,未重新配置cuDNN,重新测试,运行成功,没错误。

小技巧

如果你在配置的时候不清楚你安装的TensorFlow版本目前支持CUDA和cuDNN的版本是多少,可以先安装好TensorFlow库后,从安装的TensorFlow库文件夹中(C:\Users\Administrator\AppData\Roaming\Python\Python36\site-packages\tensorflow\python\platform)找到build_info.py文件,里面写着CUDA和cuDNN的版本,从代码中可以看到:
cuda_version_number = ‘9.0’
cudnn_version_number = ‘7’
我们按照这个版本号安装就不会出现各种各样的问题了。

最后可以愉快的使用GPU训练模型了,附上训练模型图一张

本文标签: 深度 环境 TensorFlow Keras