目录

用学校的超算跑深度学习模型时,运行train的代码,出现了错误:

urllib.error.URLError: 

​解决: 

 1.在/etc/resolv.conf中添加 nameserver  8.8.8.8

 2.根据报错去解决


用学校的超算跑深度学习模型时,运行train的代码,出现了错误:

urllib.error.URLError: <urlopen error [Errno -2] Name or service not known>

报错部分截图如下:

解决: 

 1.在/etc/resolv.conf中添加 nameserver  8.8.8.8

此办法因为是学校的超算,普通的用户没有权限去修改/etc/resolv.conf配置

 2.根据报错去解决

注意到报错的关键点在这两行:

Downloading: "https://download.pytorch.org/models/resnet50-19c8e357.pth" to /public/home/hpc204611038/.cache/torch/hub/checkpoints/resnet50-19c8e357.pth

发现是下载.pth文件到文件夹/pub lic/home/hpc204611038/.cache/torch/hub/checkpoints/的过程中报错了,是因为gpu节点下是没有网络的,所以会下载失败,那我们就点击这个链接在自己电脑的浏览器上先把resnet50-19c8e357.pth文件下载下来,之后复制到文件夹/pub lic/home/hpc204611038/.cache/torch/hub/checkpoints/中,最后再运行train就成功了。(或者切换到cpu节点下,再激活conda下载)

下面是由于自己的电脑没有网络后断开后,超算显示的界面:

 


 

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐