admin 一、背景说明 书接上回,GPU合集前两篇文章介绍了NVIDIA GPU 基础环境值Driver的安装与使用,对nvidia-smi的命令进行详解。 一、NVIDIA GPU基础环境部署(驱动) 二、nvidia-smi 系列命令介绍 截至目前各位看官已掌握N卡的基础设备信息查看,但是要想进一步对N卡进行相关功能测试、性能测试或者应用部署,还需要安装cuda基础环境。这篇内容就围绕cuda展开介绍。 二、CUDA是什么 首先cuda不是一个单独的软件,而是一整套软硬件结合的解决方案。 它提供了一套基础设施,让CPU(主机)和GPU(设备)可以协同工作。你可以把CPU看作一个博学的“老教授”,而GPU则是成千上万个“小学生”。CUDA就是让老教授(CPU)把一项可以拆分成无数个小任务的工作(比如数一亿颗豆子)分发给所有小学生(GPU)同时去完成。 它又是一个编程模型,扩展了C/C++、Python 等编程语言,让你能够直接编写在 GPU 上运行的代码。这段在GPU上运行的代码叫做核函数。 CUDA的核心作用是:解锁 GPU 的并行计算能力,用于处理非图形任务(其余内容可网上资料自行查阅,不再赘述)。 三、CUDA下载 下载链接:cuda 进入官网,选择需要的版本进行安装,可以下载最新版本Latest Release、也可以选择历史版本Archived Releases进行下载。 问:那该如何判断你需要什么版本呢?太旧行不行? ——答,不可以。需要按照你安装的驱动,使用nvidia-smi查看驱动支持的cuda版本(可以比这里的版本高,但不能比它低),然后下载,如下图红框位置的版本: 四、CUDA安装 cuda文件赋予权限(不论离线下载或者在线下载到OS内,首先需要chmox +x 文件名) 执行cuda文件进行安装,在弹出的交互窗口输入accept,回车,如果按照博主前文指导已经提前安装了驱动文件,在弹出页面取消勾选安装驱动,然后下移光标到install,回车执行安装。(对于老手来说,可以直接下载cuda后安装cuda配套的驱动版本,没什么区别) 等待安装完成 配置环境变量,查看cuda安装路径 使用vim ~/.bashrc,在文件末尾输入如下四行环境变量(注意第一行的绝对路径为第四步确认的路径)然后保存并退出 执行source ~/.bashrc 环境变量生效 使用nvcc -V确认cuda安装成功环境变量配置OK 五、cuda卸载 如果需要升级或降级另一个版本的cuda,在/usr/local/cuda-12.8/bin 路径下(为自己安装版本的路径)执行cuda-uninstaller进行卸载操作(其实在安装完成的提示中就有说明如何卸载奥)。