我们在测试大模型,深度学习的过程中,可能遇到的情况就是不断的清空系统,避免老系统中安装的软件对测试系统造成影响,导致测试结果不准确或莫名报错。今天为小伙伴们介绍使用PVE7做成一个人工智能开发和测试的平台,你可以在这个平台上任意设置虚拟机进行测试,可以对已经测试过的系统进行备份,随时还原原系统状态。

*你可以将人工智能初始状态的虚拟机做成模板,需要测试时可以由模板迅速搭建测试系统。

*已经完成测试的模型,你可以把他生成模板,或进行克隆、备份等操作,需要使用时可迅速还原你需要的状态。

演示系统配置

1、操作系统debian11.5

2、E5-2696V4 2颗,128GB DDR3

3、GPU  2片24G Nvidia P40 水冷。

一:安装GPU

1、安装Debian操作系统

2、安装编译环境

#更新系统
sudo apt update

#安装gcc和g++
sudo apt update
sudo apt install gcc g++

#查看版本
gcc --version
g++ --version

#安装make,下面两个分别安装哦
sudo apt install make 
sudo apt install make-guile

#查看make版本
make -v

3、安装依赖并关闭nouveau的控制

#安装依赖
apt install pkg-config
apt install linux-headers*

#关闭nouveau的控制
$sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
$sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

完成上面安装后重启服务器

4、安装Nvidia驱动程序

Nvidia驱动下载:官方驱动 | NVIDIA

 

#卸载旧的linux驱动
apt-get purge nvidia*

#上传官网nvidia驱动,并进入驱动所在路径,赋予执行权限,并执行安装命令
chmod +x NVIDIA-Linux-x86_64-535.86.05.run
./NVIDIA-Linux-x86_64-535.86.05.run

执行nvidia-smi来确认GPU是否正确安装

二:安装PVE7

1、修改机器名及解析

vim /etc/hostname

修改你希望的机器名,例如将服务器名设置为:debian

2、修改hosts文件

vim /etc/hosts

127.0.0.1         localhost
192.168.29.25     debian

3、修改国内源

#先备份一下
cp /etc/apt/sources.list /etc/apt/sources.list.bak

#编辑sources.lits
vim /etc/apt/sources.list

#修改内容如下:
deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye main contrib non-free
deb-src https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye main contrib non-free
deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye-updates main contrib non-free
deb-src https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye-updates main contrib non-free
deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye-backports main contrib non-free
deb-src https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye-backports main contrib non-free
deb https://mirrors.tuna.tsinghua.edu.cn/debian-security bullseye-security main contrib non-free
deb-src https://mirrors.tuna.tsinghua.edu.cn/debian-security bullseye-security main contrib non-free

4、添加PVE存储库

echo "deb [arch=amd64] https://mirrors.tuna.tsinghua.edu.cn/proxmox/debian bullseye pve-no-subscription" > /etc/apt/sources.list.d/pve-install-repo.list

5、添加PVE存储库密钥

wget https://enterprise.proxmox.com/debian/proxmox-release-bullseye.gpg -O /etc/apt/trusted.gpg.d/proxmox-release-bullseye.gpg

6、更新存储库和系统

apt update && apt full-upgrade

7、安装PVE

apt install proxmox-ve postfix open-iscsi

8、安装完成后删除不必要的prober文件

apt remove os-prober

然后重启服务器

三:登录PVE

1、登录方式

https://192.168.29.25:8006

注意这里的IP地址是你服务器的地址,请根据实际情况填写。

语言可以选择中文,方便阅读。

2、为虚拟机添加GPU显卡

先创建一个虚拟机,然后向虚拟机添加GPU卡:

在设备中找到P40显卡

将上面三项打勾,然后确定【OK】

3、使用MDev,请参考上一篇文章,PVE 7.4-17 中开启vGPU显卡虚拟化-CSDN博客

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐