目录

用学校的超算跑深度学习模型时,运行train的代码,出现了错误:

urllib.error.URLError: 

​解决: 

 1.在/etc/resolv.conf中添加 nameserver  8.8.8.8

 2.根据报错去解决


用学校的超算跑深度学习模型时,运行train的代码,出现了错误:

urllib.error.URLError: <urlopen error [Errno -2] Name or service not known>

报错部分截图如下:

解决: 

 1.在/etc/resolv.conf中添加 nameserver  8.8.8.8

此办法因为是学校的超算,普通的用户没有权限去修改/etc/resolv.conf配置

 2.根据报错去解决

注意到报错的关键点在这两行:

Downloading: "https://download.pytorch.org/models/resnet50-19c8e357.pth" to /public/home/hpc204611038/.cache/torch/hub/checkpoints/resnet50-19c8e357.pth

发现是下载.pth文件到文件夹/pub lic/home/hpc204611038/.cache/torch/hub/checkpoints/的过程中报错了,是因为gpu节点下是没有网络的,所以会下载失败,那我们就点击这个链接在自己电脑的浏览器上先把resnet50-19c8e357.pth文件下载下来,之后复制到文件夹/pub lic/home/hpc204611038/.cache/torch/hub/checkpoints/中,最后再运行train就成功了。(或者切换到cpu节点下,再激活conda下载)

下面是由于自己的电脑没有网络后断开后,超算显示的界面:

 


 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐