安装cuda、cudnn、pytorch-gpu

时间:2024-03-05 09:01:51
安装CUDA 11.8

按照官网步骤一步一步装完即可,安装完之后配置路径

sudo vim ~/.bashrc

添加

export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
export CUDA_ROOT=/usr/local/cuda-11.8
export CPATH=/usr/local/cuda-11.8/include:$CPATH

下载CUDA 11.8对应的CUDNN

Download cuDNN v8.9.3 (July 11th, 2023), for CUDA 11.x

Local Installer for Linux x86_64 (Tar)

tar -xvf  ""

进入到解压后的文件,分别把include和lib复制到

/usr/local/cuda-11.8/include 和 /usr/local/cuda-11.8/bin64 中

添加权限

sudo chmod a+r /usr/local/cuda-11.8/include/cudnn.h

sudo chmod a+r /usr/local/cuda-11.8/lib64/libcudnn*

验证

进入到 /usr/local/cuda/extras/demo_suite

./bandwidthTest 和 ./deviceQuery,最后看到

Result = PASS

就是安装成功

然后安装anaconda

nvcc -V   查看cuda版本

https://www.anaconda.com/download#downloads

xxxxxxxxxx -c //在客户端模式下运行-u //使用UDP而不是TCP–sctp //使用 SCTP 而不是 TCP(Linux、FreeBSD 和 Solaris)-b //UDP模式使用的带宽,单位bits/sec。此选项与-u选项相关。默认值是1 Mbit/sec-t //设置传输的总时间。Iperf在指定的时间内,重复的发送指定长度的数据包。默认是10秒钟。-n //要传输的字节数,通常情况,Iperf按照10秒钟发送数据。-n参数跨越此限制,按照指定次数发送指定长度的数据,而不论该操作耗费多少时间。-k //要传输的块(数据包)数-i //要读取或写入的缓冲区的长度。TCP 的默认值为 128 KB,UDP 的默认值为 8 KB-r //分别进行双向测试-P //大写字母P,要运行的并行客户端流的数量​-d 同时进行双向传输测试-n 指定传输的字节数,eg:iperf -c 222.35.11.23 -n 100000-r 单独进行双向传输测试-t 测试时间,默认10秒,eg:iperf -c 222.35.11.23 -t 5-F 指定需要传输的文件-T 指定ttl值bash

vim ~/.bashrc
# 把下边语句添加到最后
export PATH=$PATH:anaconda3安装路径
例:
export PATH=$PATH:/home/kunsir/anaconda3

默认安装带有cpu版的torch,首先卸载

pip uninstall torch

然后去Pytorch官网https://pytorch.org/get-started/locally/

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

安装完验证

import torch
print(torch.version.cuda)
print(torch.cuda.is_available())
print(torch.backends.cudnn.version())

卸载nvidia-driver

#1.先把之前的nvidia驱动卸载干净:
sudo apt-get remove --purge nvidia*
fatal error: opencv2/opencv.hpp: No such file or directory

https://opencv.org/get-started/

进入官网 选择环境,安装完成后,运行下边命令

sudo ln -s /usr/include/opencv4/opencv2 /usr/include/