首先ngc全称是Nidia GPU Cloud,英伟达云计算平台,该平台是一个集成式平台,专门为人工智能、机器学习和深度学习应用而设计。NGC 提供了各种优化的深度学习框架、预训练模型、AI 工具和容器,以协助开发人员快速开发和部署深度学习应用程序。

下面主要介绍的是ngc 容器,ngc容器是基于 Docker 容器构建的深度学习应用程序,其中包含了经过优化的深度学习框架和库、各种 AI 工具和预训练模型,是 Docker Hub 的有效补充。

此容器解决了什么问题?

  1. 避免了在主机中安装多个版本cuda、cudnn等库,导致环境混乱;
  2. 解决由于系统版本过高或过低无法配置高版本深度学习训练和推理的环境;
  3. 使用docker容器,让主机环境更独立,更简洁;

如何部署?

  1. 首先,需要安装docker, 简单梳理以下安装docker的流程:

    # 安装所需依赖
    sudo apt update
    sudo apt install apt-transport-https ca-certificates curl software-properties-common
    # 添加docker官方GPG密钥
    curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
    # 添加docker存储库
    echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
    # 更新软件包索引
    sudo apt update
    #安装Docker引擎
    sudo apt install docker-ce docker-ce-cli containerd.io
    #验证docker是否安装成功
    docker -V
    

请添加图片描述

  1. docker 登陆NGC

    因为NGC 容器镜像是需要登录才能下载的,而不像 Docker Hub 可以随便下载。

​ 2.1 打开nvida NGC官方网站(https://catalog.ngc.nvidia.com/),选择为右上角setup
请添加图片描述

​ 2.2 点击“Get API Key”, 如果你这里没有这个选项,2.1中查看是否登陆官网

请添加图片描述

2.3 点击右上角的“Generate API Key”
请添加图片描述

2.4 生成的API Key如下,按照红框中操作进行登陆
请添加图片描述

2.5 通过docker登陆NGC nvcr.io, 用户名和密码是2.4中生成的,复制过来即可
请添加图片描述

  1. 下载NGC容器

    这里就和普通的docker hub一致了,在官方网站找到适合的镜像进行docker pull即可,我这里选择了cuda10.1的

请添加图片描述
请添加图片描述

我这里报了一个错误,这个错误是很常见的docker错误,原因是普通用户没有使用docker命令的权限,需要将普通用户添加进组即可,

sudo gpasswd -a <username> docker
newgrp docker

请添加图片描述
再重复docker pull的过程,等待2分钟,pull finished!
请添加图片描述

到这里ngc镜像安装完成,快跑跑你的算法!

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐