在线备忘录(一)在windows系统中使用Anaconda配置深度学习环境

在线备忘录


(一)在windows系统中使用Anaconda配置深度学习环境

  • 在线备忘录
  • 前言
  • 正文
    • 1.查看NVIDIA显卡支持的CUDA驱动版本
    • 2.安装Anaconda
    • 3.建立新的虚拟环境
    • 4.安装Cudatoolkit,cuDNN及Pytorch
  • 写在最后

前言

“在线备忘录”用于记录工作中遇到的部分技术问题,内容大多转载或整理自中文论坛博客,经个人二次加工形成,将尽量注明其直接出处。

由于时间、个人水平有限,且该备忘录主要目的为个人记录,因此该教程不一定适合没有接触过任命令行终端的新手,不详尽之处(some skips)请参考其他具体资料。


正文

1.查看NVIDIA显卡支持的CUDA驱动版本

打开NVIDIA控制面板(可搜索"NVIDIA Control Panel"),【系统信息】-【组件】,可看到NVIDIA驱动所支持的最高CUDA版本(即driver API版本),使用时版本取决于环境中的runtime(运行时) API版本。若没有驱动 :https://www.nvidia.cn/Download/index.aspx?lang=cn


具体可参考该链接
https://developer.nvidia.com/cuda-toolkit-archive
如果还有游戏等用途,可以在NVIDIA官网下载CUDA,但是当只需要配置深度学习环境时使用anaconda安装pytorch/NVIDIA/…发布的cudatoolkit更方便,且可以切换不同版本(个人意见,欢迎指教)


2.安装Anaconda

(教程很多,此处略)


3.建立新的虚拟环境

打开Anaconda终端,在初始的base环境下创建虚拟环境。这里将虚拟环境名称设为test_env,python版本为3.8:

conda create -n test_env python=3.8

完成后显示:
Anaconda终端界面
查看所有环境,以检查虚拟环境是否已创建好:

conda env list

激活刚才建立的虚拟环境test_env,以在接下来使用pip/conda命令安装第三方库到该虚拟环境中(附:如果不使用wheel文件安装就不用关心其路径):

conda activate test_env

附:退出虚拟环境:

conda deactivate

附:删除虚拟环境使用conda remove -n [env_name] –all 参数不一定对,可以使用:

conda env remove --name [env_name]

4.安装Cudatoolkit,cuDNN及Pytorch

由于需要综合考虑python,pytorch,cudatoolkit与cuda驱动之间的关系,方便起见可以直接在torch或者anaconda官网上找torch库的安装命令。这里以torch官网的操作为例:
选好操作系统等参数后,点击button查看其他版本
选好操作系统等参数后,点击button查看其他版本。
以torch1.8.0为例,使用该命令安装torch,将自动安装带有cudatoolkit(11.1),torchvision等组件:
以torch1.8.0为例,使用该命令安装torch,带有cudatoolkit(11.1),torchvision等组件

将该命令复制到终端,执行:
这里显示失败的原因可能与镜像失效有关吧(欢迎指教)
(这里显示failed的原因可能与镜像失效有关吧,欢迎指教)
输入y以继续安装(当然倒回来检查一下路径和哪些依赖库总是一个好习惯)
输入y以继续安装(当然倒回来检查一下路径和哪些依赖库总是一个好习惯)
(>1.2G,只好等几分钟吧)

之后还需安装cuDNN,否则此步骤完成后torch库的计算只能在CPU上运行,与GPU无关。

参考这里

可到NVIDIA-cudnn找与cudatoolkit一致的cuDNN版本(链接)(需要注册)。若可直接安装,则忽略下步。

注:下载wheel离线安装速度较快较稳定

在anaconda仓库上找该版本的cuDNN进行安装(从NVIDIA下载安装文件并配置比较麻烦教程)。
在这里插入图片描述

(Anaconda一般不需要注册,直接搜索第三方库名cudnn和版本号即可)
在这里插入图片描述
在这里插入图片描述
同样在终端运行以上命令,以安装cuDNN:
检查时发现这里为11.3
最后检查是否可用cuda加速计算:

法一:输入nvcc --version
在这里插入图片描述
法二:依次执行:

python
import torch
torch.cuda.is_available()
torch.cuda.device_count()
exit()

在这里插入图片描述
环境配置成功。

若false,使用conda list命令可查看版本详细信息(如误装torch-cpu版)
参考


写在最后

本过程在win10(64),anaconda on win32, conda = 4.12.0,cuda driver = 11.4亲测可用,linux系统除安装anaconda不一样以外其他步骤基本相同。
本文仅供参考。