最佳实践
Linux安装Nvidia驱动和Cuda

Linux安装Nvidia驱动和Cuda

安装驱动

举例4090系列驱动安装

第一步:驱动官方下载地址:https://www.nvidia.cn/drivers/lookup/ (opens in a new tab)

图片
图片

Product Type:(4090、3090、2080、2080Ti、3080Ti 等)/ (A800、A100、V100S、T4、L20 等)
Geforce Data Center / TeslaProduct Series:选择对应产品系列:eg 4090: / V100S: GeForce RTX 40 Series V-Series
Product: 选择具体显卡型号: eg 4090: / V100S: NVIDIA Geforce 4090 Tesla V100S

图片

点击查看
图片

右键复制链接地址

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/550.90.07/NVIDIA-Linux-x86_64-550.90.07.run   

第二步:安装驱动

chmod +x NVIDIA-Linux-x86_64-550.90.07.run
sudo ./NVIDIA-Linux-x86_64-550.90.07.run

第三步:安装完成校验

nvidia-smi

显示如图则表示驱动安装成功

图片

安装CUDA

第一步:官网下载CUDA :https://developer.nvidia.com/cuda-toolkit-archive (opens in a new tab)

选择对应系统和CUDA版本(执行 # nvidia-smi 可查看驱动适配的最高cuda版本,小于等于Nvidia驱动的cuda版本)

图片

然后wget下载到虚机本地,然后sudo sh cuda_xxxxxxx_linux.run 进行安装。

图片

第二步:打X的则是选择安装的,Install等待安装完成。如下图所示:

图片

第三步:配置环境变量,添加软链接,添加环境变量

sudo vim /etc/profile 编辑文件,在末尾添加;

export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存退出,添加软链接 sudo ln -s /usr/local/cuda-10.1 /usr/local/cuda (修改版本号即可,eg:10.1) 重启reboot

第四步:验证cuda环境是否配置完成

nvcc -V 则表示环境配置完成

图片

Q&A

  1. Nouveau驱动未禁止

图片

点击OK,选择Yes让Nvidia驱动自主创建,一直OK,退出后,reboot。

图片

  1. kernel-devel 与kernel-headers版本不一致

图片

uname -a
Centos  
rpm -qa | grep -E "kernel-devel|kernel-headers"
kernel-devel
sudo yum install kernel-devel-$(uname -r)
Ubuntu
sudo apt-get update
sudo apt-get install linux-headers-$(uname -r)
Reboot

注:若找不到对应的内核版本,则需要网上搜索抑或升级内核版本,匹配对应的软件版本号

Copyright © 2025 沪ICP备12020087号-61