NVIDIA 驱动与 CUDA 安装指南
1. 概述
本指南详细说明如何在 Linux 系统上下载、安装并验证 NVIDIA GPU 驱动 和 CUDA Toolkit。
驱动与 CUDA 的关系
| 组件 | 作用 | 安装包 | 验证命令 |
|---|---|---|---|
| NVIDIA 驱动 | 操作系统与 GPU 硬件之间的通信层,提供内核模块和用户态库 | NVIDIA-Linux-x86_64-*.run |
nvidia-smi |
| CUDA Toolkit | GPU 并行计算开发工具包,包含编译器 (nvcc)、运行时库、示例代码 | cuda_*_linux.run |
nvcc --version |
版本兼容性规则: nvidia-smi 显示的 CUDA 版本(Driver API)必须 大于或等于 nvcc --version 显示的 CUDA 版本(Runtime API)。
| 驱动分支 | 最新版本 | 支持 CUDA | 支持架构 |
|---|---|---|---|
| R590 | 590.48.01 | 13.1 | Blackwell, Hopper, Ada, Ampere |
| R580 | 580.105.08 | 13.0 | Hopper, Ada, Ampere |
| R570 | 570.133.20 | 12.8 | Hopper, Ada, Ampere, Turing |
| R550 | 550.144.03 | 12.4 | Hopper, Ada, Ampere, Turing |
| R535 | 535.86.10 | 12.2 | H800, L40S (特定硬件) |
| R510 | 510.47.03 | 11.6 | A30, A100 (特定硬件) |
| R470 | 470.82.01 | 11.4 | T4, P4 (特定硬件) |
支持的操作系统
- RHEL / CentOS 7 / 8 / 9
- Rocky Linux 8 / 9
- Ubuntu 20.04 / 22.04 LTS / 24.04 LTS
- Debian 10 / 11 / 12
- SUSE Linux Enterprise 15 SP6/SP7
2. 如何下载 NVIDIA 驱动
2.1 官网手动下载
GeForce 驱动: https://www.nvidia.cn/geforce/drivers/
选择流程:
- 产品类型: GeForce
- 产品系列: 根据 GPU 型号选择(如 GeForce RTX 40 Series)
- 产品型号: 选择具体 GPU(如 GeForce RTX 4090)
- 操作系统: Linux 64-bit
- 语言: Chinese (Simplified)
- 点击 搜索 → 下载
Data Center 驱动: https://www.nvidia.com/en-us/drivers/
选择流程:
- Product Type: Data Center / Tesla
- Product Series: 根据 GPU 型号选择(如 H-Series, A-Series, T-Series)
- Product: 选择具体 GPU(如 NVIDIA H100, NVIDIA A100, NVIDIA T4)
- Operating System: Linux 64-bit
- 点击 Search → Download
2.2 命令行直接下载
使用 wget 直接下载 .run 文件(无需浏览器):
Data Center 驱动示例:
# R590 最新版 (2025-12)
$ wget https://us.download.nvidia.com/XFree86/Linux-x86_64/590.48.01/NVIDIA-Linux-x86_64-590.48.01.run
# R580 生产版 (2025-11)
$ wget https://us.download.nvidia.com/XFree86/Linux-x86_64/580.105.08/NVIDIA-Linux-x86_64-580.105.08.run
# R570 LTS 版 (2025-04)
$ wget https://us.download.nvidia.com/XFree86/Linux-x86_64/570.133.20/NVIDIA-Linux-x86_64-570.133.20.run
常见 GPU 推荐驱动版本:
| GPU 型号 | 推荐驱动 | 下载链接 |
|---|---|---|
| H100/H200/H800 | R580 或 R590 | https://www.nvidia.com/en-us/drivers/details/257732/ |
| A100/A800 | R580 | https://www.nvidia.com/en-us/drivers/details/257732/ |
| A30/A40 | R580 | 同上 |
| L40S | R550 或 R580 | https://www.nvidia.com/en-us/drivers/ |
| T4 | R470 或 R550 | https://www.nvidia.com/en-us/drivers/ |
| RTX 4090/4080 | R590 | https://www.nvidia.cn/geforce/drivers/ |
| RTX 2080 Ti | R455 或 R550 | https://www.nvidia.cn/geforce/drivers/ |
2.3 本地下载📁 本地下载
提示:点击按钮将打开网络文件夹,点击即可下载
本地服务器已预置常用 GPU 的 NVIDIA 驱动 .run 安装文件:
| 驱动版本 | 适用 GPU | 文件名 |
|---|---|---|
| R590 (590.48.01) | H100/H200, RTX 4090 | NVIDIA-Linux-x86_64-590.48.01.run |
| R580 (580.105.08) | H100, A100/A800, L40S | NVIDIA-Linux-x86_64-580.105.08.run |
| R570 (570.133.20) | Hopper, Ada, Ampere, Turing | NVIDIA-Linux-x86_64-570.133.20.run |
| R550 (550.144.03) | T4, RTX 2080 Ti | NVIDIA-Linux-x86_64-550.144.03.run |
| R470 (470.82.01) | T4, P4 | NVIDIA-Linux-x86_64-470.82.01.run |
2.4 包管理器安装
RHEL/CentOS/Rocky:
# 安装 EPEL 和 ELRepo
$ sudo yum install -y epel-release
$ sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
$ sudo yum install -y https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm
# 检测并安装推荐驱动
$ sudo yum install -y nvidia-detect
$ nvidia-detect # 查看推荐版本
$ sudo yum install -y kmod-nvidia
$ sudo reboot
Ubuntu/Debian:
# Ubuntu 自动检测并安装推荐驱动
$ sudo apt update
$ sudo apt install -y ubuntu-drivers-common
$ ubuntu-drivers devices # 查看可用驱动
$ sudo apt install -y nvidia-driver-590 # 安装指定版本
$ sudo reboot
3. 如何下载 CUDA Toolkit
3.1 官网下载
CUDA Toolkit 下载页面: https://developer.nvidia.com/cuda-downloads
选择流程:
- Operating System: Linux
- Architecture: x86_64(或 sbsa for ARM)
- Distribution: 选择你的系统(Ubuntu / RHEL / Debian / Fedora 等)
- Version: 选择系统版本号
- Installer Type: runfile (local) (推荐,通用性最强)
页面将自动生成 wget 下载命令。
CUDA 历史版本: https://developer.nvidia.com/cuda-toolkit-archive
3.2 命令行直接下载
最新 CUDA 13.x 系列:
# CUDA 13.1 + Driver 590 (runfile)
$ wget https://developer.download.nvidia.com/compute/cuda/13.1.0/local_installers/cuda_13.1.0_590.48.01_linux.run
# CUDA 13.0 + Driver 580 (runfile)
$ wget https://developer.download.nvidia.com/compute/cuda/13.0.1/local_installers/cuda_13.0.1_580.105.08_linux.run
常用 CUDA 版本:
# CUDA 12.9 + Driver 575
$ wget https://developer.download.nvidia.com/compute/cuda/12.9.1/local_installers/cuda_12.9.1_575.57.08_linux.run
# CUDA 12.2 + Driver 535 (H800 常用)
$ wget https://developer.download.nvidia.com/compute/cuda/12.2.1/local_installers/cuda_12.2.1_535.86.10_linux.run
# CUDA 11.6 + Driver 510 (A30 常用)
$ wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
# CUDA 11.1 + Driver 455 (RTX 2080 Ti 常用)
$ wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
3.3 本地下载📁 本地下载
提示:点击按钮将打开网络文件夹,点击即可下载
本地服务器已预置常用 CUDA Toolkit .run 安装文件:
| CUDA 版本 | 包含驱动 | 文件名 |
|---|---|---|
| CUDA 13.1 | R590 (590.48.01) | cuda_13.1.0_590.48.01_linux.run |
| CUDA 13.0 | R580 (580.105.08) | cuda_13.0.1_580.105.08_linux.run |
| CUDA 12.9 | R575 (575.57.08) | cuda_12.9.1_575.57.08_linux.run |
| CUDA 12.2 | R535 (535.86.10) | cuda_12.2.1_535.86.10_linux.run |
| CUDA 11.6 | R510 (510.39.01) | cuda_11.6.0_510.39.01_linux.run |
3.4 发行版包安装
Ubuntu (deb local):
$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
$ sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ wget https://developer.download.nvidia.com/compute/cuda/13.1.0/local_installers/cuda-repo-ubuntu2404-13-1-local_13.1.0-590.48.01-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu2404-13-1-local_13.1.0-590.48.01-1_amd64.deb
$ sudo cp /var/cuda-repo-ubuntu2404-13-1-local/cuda-*-keyring.gpg /usr/share/keyrings/
$ sudo apt-get update
$ sudo apt-get -y install cuda-toolkit-13-1
RHEL/Rocky (rpm local):
$ sudo rpm -i cuda-repo-rhel8-13-1-local-13.1.0_590.48.01-1.x86_64.rpm
$ sudo dnf clean all
$ sudo dnf -y install cuda-toolkit-13-1
4. 如何安装 NVIDIA 驱动
★ 4.1 安装前准备
4.1.1 确认 GPU 已被系统识别
$ lspci | grep -i nvidia
# 应看到类似: 3b:00.0 3D controller: NVIDIA Corporation GA100 [A100] (rev a1)
若无输出 → 检查 GPU 是否正确插入,BIOS 中是否启用了对应 PCIe 插槽。
4.1.2 安装编译依赖
RHEL/CentOS/Rocky:
$ sudo yum install -y gcc gcc-c++ make kernel-devel-$(uname -r) dkms
$ sudo yum groupinstall -y "Development Tools"
Ubuntu/Debian:
$ sudo apt update
$ sudo apt install -y gcc g++ make build-essential dkms linux-headers-$(uname -r)
4.1.3 ★ 禁用 Nouveau 开源驱动
Nouveau 是 Linux 自带的 NVIDIA 开源驱动,与官方驱动冲突,安装前必须禁用。
方法一:手动禁用 (通用):
# 1. 创建黑名单配置文件
$ sudo bash -c "cat > /etc/modprobe.d/blacklist-nouveau.conf << EOF
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
EOF"
# 2. 重建 initramfs
# RHEL/CentOS 7
$ sudo dracut --force
# RHEL/CentOS 8/9, Fedora
$ sudo dracut -f /boot/initramfs-$(uname -r).img $(uname -r)
# Ubuntu/Debian
$ sudo update-initramfs -u
# 3. ★ 重启系统
$ sudo reboot
方法二:卸载 Nouveau (Ubuntu/Debian):
$ sudo apt-get --purge remove xserver-xorg-video-nouveau
4.1.4 确认 Nouveau 已被禁用
$ lsmod | grep nouveau
# 应无输出
4.1.5 关闭图形界面 (可选,服务器通常不需要)
# 设为多用户文本模式
$ sudo systemctl set-default multi-user.target
$ sudo systemctl isolate multi-user.target
# 或临时停止显示管理器
$ sudo service gdm stop # GNOME
$ sudo service lightdm stop # LightDM
4.2 .run 文件安装 (★ 通用推荐方法)
.run 文件是 NVIDIA 官方提供的最通用安装方式,适用于所有 Linux 发行版。
方法一:静默安装 (Silent Install,服务器推荐):
$ chmod +x NVIDIA-Linux-x86_64-*.run
$ sudo ./NVIDIA-Linux-x86_64-*.run --silent --disable-nouveau --dkms
# 参数说明:
# --silent 静默安装,无交互提示
# --disable-nouveau 自动禁用 Nouveau 驱动
# --dkms 使用 DKMS 管理内核模块,内核升级后自动重建
静默安装可选参数:
| 参数 | 说明 |
|---|---|
--silent |
静默模式,无交互 |
--disable-nouveau |
自动检查并禁用 Nouveau |
--dkms |
使用 DKMS 注册内核模块 |
--no-opengl-files |
不安装 OpenGL 库(服务器推荐,避免与系统 Mesa 冲突) |
--no-questions |
跳过所有确认问题 |
--ui=none |
不使用 GUI 界面 |
--log-file-name= |
指定安装日志路径 |
方法二:交互式安装:
$ chmod +x NVIDIA-Linux-x86_64-*.run
$ sudo ./NVIDIA-Linux-x86_64-*.run
# 依次回答:
# 1. Accept EULA (选择 Accept)
# 2. Install NVIDIA's 32-bit compatibility libraries (服务器选 No)
# 3. Would you like to run nvidia-xconfig? (选 No)
# 4. Install DKMS? (选 Yes)
4.3 RPM 包安装 (RHEL/CentOS/Rocky)
适用于有本地 RPM 仓库的场景:
# 1. 安装本地仓库 RPM
$ sudo rpm -i nvidia-driver-local-repo-rhel8-580.82.07-1.0-1.x86_64.rpm
# 2. 刷新仓库并安装
$ sudo dnf clean all
$ sudo dnf -y module install nvidia-driver:latest-dkms
# 或安装特定版本
$ sudo dnf -y install cuda-drivers
# 3. 重启
$ sudo reboot
4.4 DEB 包安装 (Ubuntu/Debian)
# 1. 安装本地仓库 DEB
$ sudo dpkg -i nvidia-driver-local-repo-debian12-580.105.08_1.0-1_amd64.deb
# 2. 导入 GPG Key
$ sudo cp /var/nvidia-driver-local-repo-*/cuda-*-keyring.gpg /usr/share/keyrings/
# 3. 更新并安装
$ sudo apt-get update
$ sudo apt-get -y install cuda-drivers
# 4. 重启
$ sudo reboot
4.5 安装后重启并验证
$ sudo reboot
# 重启后检查
$ nvidia-smi
5. 如何安装 CUDA Toolkit
5.1 Runfile 安装 (★ 推荐/通用方法)
方法一:静默安装:
$ chmod +x cuda_*_linux.run
$ sudo sh cuda_*_linux.run --silent --toolkit --override
# 参数说明:
# --silent 静默安装
# --toolkit 仅安装 CUDA Toolkit (不安装驱动)
# --override 覆盖已存在的文件
如果驱动还未安装,可同时安装驱动:
$ sudo sh cuda_*_linux.run --silent --toolkit --driver --override
# --driver: 同时安装 CUDA runfile 中自带的 NVIDIA 驱动
方法二:交互式安装:
$ sudo sh cuda_*_linux.run
交互步骤:
- 输入
accept并回车(接受 EULA) - 使用方向键和空格键选择/取消组件:
- [X] Driver — 如果已安装驱动,取消此项 (按空格取消勾选)
- [X] CUDA Toolkit 13.1 — 保持勾选
- [ ] CUDA Samples 13.1 — 建议勾选(用于编译验证)
- [ ] CUDA Demo Suite 13.1 — 可选
- 选择 Install 回车
5.2 DEB/RPM 包安装
参见 3.3 发行版包安装,下载的 deb/rpm 已包含 CUDA 和驱动。
仅安装 CUDA 工具包 (不含驱动):
# Ubuntu
$ sudo apt-get install -y cuda-toolkit-13-1
# RHEL
$ sudo dnf install -y cuda-toolkit-13-1
★ 5.3 环境变量配置
安装完成后必须配置环境变量:
# 编辑 ~/.bashrc
$ vi ~/.bashrc
# 添加以下内容 (根据实际安装路径调整版本号)
export CUDA_HOME=/usr/local/cuda
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
# 如果安装了特定版本:
# export CUDA_HOME=/usr/local/cuda-13.1
# export PATH=/usr/local/cuda-13.1/bin:$PATH
# export LD_LIBRARY_PATH=/usr/local/cuda-13.1/lib64:$LD_LIBRARY_PATH
# 使配置生效
$ source ~/.bashrc
验证环境变量:
$ echo $CUDA_HOME
# /usr/local/cuda
$ which nvcc
# /usr/local/cuda/bin/nvcc
5.4 多版本 CUDA 共存与切换
# 查看已安装的 CUDA 版本
$ ls /usr/local/ | grep cuda
# 切换版本 (更新软链接)
$ sudo rm -rf /usr/local/cuda
$ sudo ln -s /usr/local/cuda-13.1 /usr/local/cuda # 切换到 13.1
$ sudo ln -s /usr/local/cuda-12.9 /usr/local/cuda # 切换到 12.9
# 验证
$ nvcc --version
6. 如何检查是否安装成功
6.1 驱动验证 — nvidia-smi
$ nvidia-smi
期望输出:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 590.48.01 Driver Version: 590.48.01 CUDA Version: 13.1 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 NVIDIA A100 On | 00000000:3B:00.0 Off | 0 |
| N/A 32C P0 49W / 400W | 0MiB / 40960MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
关键检查点:
Driver Version显示正确的驱动版本CUDA Version显示驱动支持的 CUDA API 版本(非已安装的 CUDA Toolkit 版本)- GPU 列表完整(所有 GPU 都应显示)
Persistence-M为On(生产环境建议开启)
实时监控:
$ nvidia-smi -l 1 # 每秒刷新
$ watch -n 1 nvidia-smi # 同上
$ nvidia-smi -q # 详细查询模式
$ nvidia-smi topo -m # GPU 拓扑连接矩阵
6.2 CUDA 验证 — nvcc
$ nvcc --version
# 或
$ nvcc -V
期望输出:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Tue_Nov_11_10:00:00_PST_2025
Cuda compilation tools, release 13.1, V13.1.105
Build cuda_13.1.r13.1/compiler.35062945_0
★ 6.3 版本兼容性检查
# 查看驱动支持的 CUDA 版本 (Driver API)
$ nvidia-smi | grep "CUDA Version"
# CUDA Version: 13.1
# 查看已安装的 CUDA 版本 (Runtime API)
$ nvcc --version | grep "release"
# Cuda compilation tools, release 13.1, V13.1.105
规则: nvidia-smi 的 CUDA Version 必须 >= nvcc 的 release version。
| 驱动 CUDA 版本 | 可用的 Toolkit 版本 |
|---|---|
| 13.1 | 13.1, 13.0, 12.x, 11.x |
| 13.0 | 13.0, 12.x, 11.x |
| 12.8 | 12.8, 12.x, 11.x |
| 12.2 | 12.2, 12.1, 12.0, 11.x |
6.4 内核模块验证
$ lsmod | grep nvidia
期望输出:
nvidia_drm 143360 0
nvidia_modeset 1540096 1 nvidia_drm
nvidia_uvm 5943296 0
nvidia 85569536 2 nvidia_uvm,nvidia_modeset
drm_kms_helper 307200 2 ast,nvidia_drm
drm 655360 6 drm_kms_helper,ast,nvidia_drm,nvidia
6.5 编译测试 — deviceQuery
编译并运行 CUDA examples 中的 deviceQuery:
# 进入 CUDA Samples 目录
$ cd /usr/local/cuda/samples/1_Utilities/deviceQuery
# 或 $ cd ~/NVIDIA_CUDA-13.1_Samples/1_Utilities/deviceQuery
# 编译
$ make
# 运行
$ ./deviceQuery
期望输出末尾:
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 13.1, CUDA Runtime Version = 13.1, NumDevs = 1
Result = PASS
6.6 常见问题排查
| 错误 | 原因 | 解决方法 | |
|---|---|---|---|
nvidia-smi: command not found |
驱动未安装或 PATH 未包含 | 检查驱动是否安装: ls /usr/bin/nvidia-smi |
|
Failed to initialize NVML |
内核模块未加载 | sudo modprobe nvidia,检查 `dmesg \ |
grep NVRM` |
nvcc: command not found |
CUDA 未安装或环境变量未设置 | 检查 ls /usr/local/cuda/bin/nvcc,重新 source ~/.bashrc |
|
Nouveau still loaded |
Nouveau 未完全禁用 | 确认黑名单配置,重建 initramfs,强制重启 | |
GCC version mismatch |
系统 GCC 版本与驱动要求不匹配 | 安装匹配的 GCC 版本,或使用 --no-cc-version-check |
|
Unable to determine the device handle |
GPU 未初始化 | 在 /etc/default/grub 中添加 pci=realloc 并 update-grub |
|
libstdc++.so.6: version GLIBCXX_3.4.20 not found |
系统 libstdc++ 版本过旧 | 升级系统或安装 compat-libstdc++ 包 |
7. 一键安装脚本
基于 install_gpu_driver.sh.txt 改进的完整自动安装脚本:
#!/bin/bash
# ──────────────────────────────────────────────
# NVIDIA 驱动 + CUDA 一键安装脚本
# 用法: bash install_gpu.sh
# ──────────────────────────────────────────────
set -e
# ★ 配置区 — 根据实际文件修改
DRIVER_FILE="NVIDIA-Linux-x86_64-590.48.01.run"
CUDA_FILE="cuda_13.1.0_590.48.01_linux.run"
echo "========================================="
echo " NVIDIA 驱动 & CUDA 自动安装脚本"
echo "========================================="
echo " 驱动: $DRIVER_FILE"
echo " CUDA: $CUDA_FILE"
echo "========================================="
# ── 1. 检查 root ──────────────────────────────
if [ "$(id -u)" -ne 0 ]; then
echo "错误: 请使用 root 权限运行此脚本"
exit 1
fi
# ── 2. 检查文件 ──────────────────────────────
if [ ! -f "$DRIVER_FILE" ]; then
echo "错误: 找不到驱动文件 $DRIVER_FILE"
exit 1
fi
if [ ! -f "$CUDA_FILE" ]; then
echo "错误: 找不到 CUDA 文件 $CUDA_FILE"
exit 1
fi
# ── 3. 检查是否已安装 ─────────────────────────
if command -v nvidia-smi &>/dev/null; then
echo "NVIDIA 驱动已安装:"
nvidia-smi | head -1
read -p "是否重新安装?(y/N) " -n 1 -r
echo
if [[ ! $REPLY =~ ^[Yy]$ ]]; then
echo "跳过驱动安装"
DRIVER_SKIP=true
fi
fi
# ── 4. 安装编译依赖 ──────────────────────────
echo ">>> 安装编译依赖..."
if command -v apt-get &>/dev/null; then
apt-get update -qq
apt-get install -y -qq gcc g++ make build-essential dkms linux-headers-$(uname -r)
elif command -v dnf &>/dev/null; then
dnf install -y gcc gcc-c++ make kernel-devel-$(uname -r) dkms epel-release
elif command -v yum &>/dev/null; then
yum install -y gcc gcc-c++ make kernel-devel-$(uname -r) dkms epel-release
fi
# ── 5. 禁用 Nouveau ──────────────────────────
echo ">>> 禁用 Nouveau..."
cat > /etc/modprobe.d/blacklist-nouveau.conf << EOF
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
EOF
if command -v dracut &>/dev/null; then
dracut --force 2>/dev/null || dracut -f /boot/initramfs-$(uname -r).img $(uname -r)
elif command -v update-initramfs &>/dev/null; then
update-initramfs -u
fi
# ── 6. 安装驱动 ──────────────────────────────
if [ "$DRIVER_SKIP" != "true" ]; then
echo ">>> 安装 NVIDIA 驱动..."
chmod +x "$DRIVER_FILE"
./"$DRIVER_FILE" --silent --disable-nouveau --dkms --no-opengl-files
echo "驱动安装完成,等待内核模块加载..."
sleep 3
fi
# ── 7. 安装 CUDA ──────────────────────────────
echo ">>> 安装 CUDA Toolkit..."
chmod +x "$CUDA_FILE"
./"$CUDA_FILE" --silent --toolkit --override
# ── 8. 配置环境变量 ──────────────────────────
echo ">>> 配置环境变量..."
CUDA_BIN=$(ls -d /usr/local/cuda/bin 2>/dev/null || echo "")
if [ -n "$CUDA_BIN" ]; then
if ! grep -q "cuda/bin" /etc/profile.d/cuda.sh 2>/dev/null; then
cat > /etc/profile.d/cuda.sh << 'EOF'
export CUDA_HOME=/usr/local/cuda
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
EOF
chmod 644 /etc/profile.d/cuda.sh
echo "环境变量已写入 /etc/profile.d/cuda.sh"
fi
fi
# ── 9. 启用持久模式 ──────────────────────────
echo ">>> 启用 GPU 持久模式..."
nvidia-smi -pm 1 2>/dev/null || true
# ── 10. 验证 ─────────────────────────────────
echo ""
echo "========================================="
echo " 安装完成!"
echo "========================================="
echo ""
echo "驱动版本:"
nvidia-smi --query-gpu=driver_version --format=csv,noheader 2>/dev/null || echo "请重启后运行 nvidia-smi"
echo ""
echo "CUDA 版本:"
nvcc --version 2>/dev/null | grep release || echo "请执行 source /etc/profile.d/cuda.sh"
echo ""
echo "★★★ 请重启系统: sudo reboot ★★★"
使用方法:
# 1. 将脚本和驱动/CUDA 文件放在同一目录
$ ls
install_gpu.sh NVIDIA-Linux-x86_64-590.48.01.run cuda_13.1.0_590.48.01_linux.run
# 2. 修改脚本中的文件名 (如需要)
$ vi install_gpu.sh
# 3. 运行
$ sudo bash install_gpu.sh
# 4. 重启
$ sudo reboot
# 5. 验证
$ nvidia-smi
$ nvcc --version
8. 参考链接
NVIDIA 官方
| 资源 | 链接 |
|---|---|
| GeForce 驱动下载 | https://www.nvidia.cn/geforce/drivers/ |
| Data Center 驱动下载 | https://www.nvidia.com/en-us/drivers/ |
| CUDA Toolkit 下载 | https://developer.nvidia.com/cuda-downloads |
| CUDA 历史版本 | https://developer.nvidia.com/cuda-toolkit-archive |
| CUDA 安装指南 (Linux) | https://docs.nvidia.com/cuda/cuda-installation-guide-linux/ |
| Data Center 驱动文档 | https://docs.nvidia.com/datacenter/tesla/ |
内部资源
| 资源 | 路径 |
|---|---|
| GPU 驱动安装 SOP | NVIDIA 驱动\GPU_Install-Drive_操作说明.docx |
| H800 Debian 安装指南 | NVIDIA 驱动\H800\readme.txt |
| T4 安装 SOP | NVIDIA 驱动\ningde-T4\P4_T4 驱动安装SOP .docm |
| GPU TEST SOP | NVIDIA 驱动\Geforce RTX 2080TI\GPU TEST SOP.docx |
| 安装.docx | NVIDIA 驱动\安装.docx |
最后更新: 2026-05-29 适用驱动: R590 / R580 / R570 / R550 / R535 / R510 / R470 适用系统: RHEL/CentOS 7/8/9, Rocky Linux 8/9, Ubuntu 20.04/22.04/24.04, Debian 10/11/12