Linux安装Nvidia驱动和Cuda
安装驱动
举例4090系列驱动安装
第一步:驱动官方下载地址:https://www.nvidia.cn/drivers/lookup/ (opens in a new tab)
Product Type:(4090、3090、2080、2080Ti、3080Ti 等)/ (A800、A100、V100S、T4、L20 等)
Geforce Data Center / TeslaProduct Series:选择对应产品系列:eg 4090: / V100S: GeForce RTX 40 Series V-Series
Product: 选择具体显卡型号: eg 4090: / V100S: NVIDIA Geforce 4090 Tesla V100S
点击查看
右键复制链接地址
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/550.90.07/NVIDIA-Linux-x86_64-550.90.07.run
第二步:安装驱动
chmod +x NVIDIA-Linux-x86_64-550.90.07.run
sudo ./NVIDIA-Linux-x86_64-550.90.07.run
第三步:安装完成校验
nvidia-smi
显示如图则表示驱动安装成功
安装CUDA
第一步:官网下载CUDA :https://developer.nvidia.com/cuda-toolkit-archive (opens in a new tab)
选择对应系统和CUDA版本(执行 # nvidia-smi 可查看驱动适配的最高cuda版本,小于等于Nvidia驱动的cuda版本)
然后wget下载到虚机本地,然后sudo sh cuda_xxxxxxx_linux.run 进行安装。
第二步:打X的则是选择安装的,Install等待安装完成。如下图所示:
第三步:配置环境变量,添加软链接,添加环境变量
sudo vim /etc/profile
编辑文件,在末尾添加;
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
保存退出,添加软链接
sudo ln -s /usr/local/cuda-10.1 /usr/local/cuda
(修改版本号即可,eg:10.1)
重启reboot
第四步:验证cuda环境是否配置完成
nvcc -V
则表示环境配置完成
Q&A
- Nouveau驱动未禁止
点击OK,选择Yes让Nvidia驱动自主创建,一直OK,退出后,reboot。
- kernel-devel 与kernel-headers版本不一致
uname -a
Centos
rpm -qa | grep -E "kernel-devel|kernel-headers"
kernel-devel
sudo yum install kernel-devel-$(uname -r)
Ubuntu
sudo apt-get update
sudo apt-get install linux-headers-$(uname -r)
Reboot
注:若找不到对应的内核版本,则需要网上搜索抑或升级内核版本,匹配对应的软件版本号