麒麟V10系统配置NVIDIA显卡驱动及DockerGPU支持
本文档基于一篇关于在 Kylin V10 上安装 NVIDIA 驱动、CUDA 和 Docker 的实践笔记整理,旨在为使用 NVIDIA GeForce RTX 3060 Ti 显卡的用户提供清晰的离线安装与配置步骤。
1. 系统环境确认
首先,确认您的操作系统版本。
1 | cat /etc/kylin-release |
预期输出应类似 Kylin Linux Advanced Server release V10 (Sword)。
2. 安装 NVIDIA 显卡驱动
步骤 1:禁用系统自带的开源驱动 (nouveau)
- 编辑黑名单配置文件:
1
sudo vi /usr/lib/modprobe.d/dist-blacklist.conf
- 找到
blacklist nvidiafb一行,在行首添加#将其注释掉。 - 在文件末尾添加以下两行内容:
1
2blacklist nouveau
options nouveau modeset=0 - 保存并退出编辑器。
步骤 2:卸载开源驱动模块并重启
1 | sudo rmmod nouveau |
步骤 3:安装驱动编译依赖
重启后,安装编译 NVIDIA 驱动所需的内核开发包和工具。
1 | sudo dnf install gcc kernel-devel-$(uname -r) kernel-headers-$(uname -r) make elfutils-libelf-devel tar bzip2 dkms acpid wget -y |
步骤 4:下载并安装官方驱动
- 下载驱动:访问 NVIDIA 官方驱动下载页面。选择产品类型为
GeForce RTX 3060 Ti,操作系统选择Linux 64-bit,点击“搜索”并下载推荐的驱动版本(例如 550 或 575 系列)。将下载的.run文件(如NVIDIA-Linux-x86_64-550.90.07.run)上传到服务器。 - 安装驱动:
1
2
3
4# 赋予安装脚本执行权限
chmod +x NVIDIA-Linux-x86_64-*.run
# 运行安装程序,按照提示操作(通常选择默认选项即可)
sudo ./NVIDIA-Linux-x86_64-*.run - 验证安装:安装完成后,运行以下命令检查显卡是否被正确识别。如果看到显卡型号、驱动版本和 GPU 状态信息,则表示驱动安装成功。
1
nvidia-smi
3. 安装 CUDA 工具包
CUDA 是进行 GPU 计算的基础平台。
- 下载 CUDA:访问 NVIDIA CUDA 下载页面。选择操作系统为
Linux->x86_64->Kylin->10->rpm (local)。页面会生成安装命令。 - 执行安装命令:复制页面提供的命令在终端中执行,例如:注意:实际命令请以官网生成的最新命令为准。
1
2
3
4wget https://developer.download.nvidia.com/compute/cuda/repos/kylin10/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda - 配置环境变量:
1
2
3echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc - 验证安装:此命令应输出已安装的 CUDA 版本号。
1
nvcc -V
4. 离线安装 Docker 并配置 GPU 支持
步骤 1:离线安装 Docker
请参考笔记 麒麟V10离线安装Docker 中详细的分架构(x86_64)离线安装步骤。该指南提供了从外网准备 RPM 包到内网服务器安装、启动和验证的完整流程。请确保按照该指南完成 Docker 的离线安装,并成功运行 docker --version 和 docker ps 命令进行验证。
步骤 2:安装 NVIDIA Container Toolkit (为 Docker 添加 GPU 支持)
这是让 Docker 容器能够使用宿主 GPU 的关键步骤。
- 配置仓库并安装:
1
2
3
4distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/libnvidia-container/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit - 配置 Docker 使用 NVIDIA 作为默认运行时:
1
2sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker - 验证 Docker GPU 支持:
运行一个测试容器,检查容器内是否能识别到 GPU。如果此命令在容器内成功输出了与宿主机1
sudo docker run --rm --gpus all nvidia/cuda:12.1.1-base-ubuntu22.04 nvidia-smi
nvidia-smi类似的 GPU 信息,则表明 Docker 已成功配置 GPU 支持,您的 RTX 3060 Ti 现在可以在容器中用于加速计算任务(如 AI 训练、图形渲染等)。
总结
整个过程可以概括为:禁用开源驱动 -> 安装 NVIDIA 官方驱动 -> 安装 CUDA 计算平台 -> 参考专用指南离线安装 Docker 引擎 -> 为 Docker 安装 NVIDIA 容器工具包。完成这些步骤后,您的麒麟 V10 系统就具备了完整的 NVIDIA GPU 计算与容器化支持环境。