PyCharm SSH远程开发配置与torch.distributed.launch分布式程序调试
PyCharm SSH远程开发设定
PyCharm SSH远程开发配置
SSH远程仅在PyCharm专业版中支持
1、Tool–>Deployment–>Configuration
2、创建服务器配置
输入name–>选择SFTP–>选择SSH Configuration–>输入相关信息
注:第2、3步其实可以跳过,直接跳至第4步,在配置远程解释器会自动创建,然后再来同步源码
Tools–>Deployment–>Configuration,选择服务器上需要映射到本地的源码目录
3、同步远程服务器上的源代码
Tools–>Deployment–>Sync Deployed to …
4、设定SSH远程调用的Python解释器
输入主机IP、端口号和用户名
选择解释器
然后就可以在本地调试服务器上代码了,本地的代码修改和服务器是同步的
PyCharm远程调试torch.distributed.launch分布式程序
1、建立软连接
在服务器项目文件夹下引入distributed(在你的环境下)软链接,
ln -s /home/username/anaconda3/envs/virtualenv_name/lib/python3.6/site-packages/torch/distributed/ yourproject
进入项目的目录,输入ls,出现蓝色的distributed文件夹,说明软链接成功
2、下载distributed
通过Tools/deployment中下载功能,将服务器上项目文件夹下的distributed文件夹下载到本地项目中
3、修改Run/Debug Configurations
参照原.sh文件中或命令行启动语句修改配置,如原启动语句:
python -m torch.distributed.launch --nproc_per_node=2 --master_port 12345 main.py --gpu 0,1
Script path:这里不再是main.py,而是distributed下的launch.py文件,这里的路径为本地项目下的路径,文件和服务器是同步的
Parameters:设置参数--nproc_per_node=2 --master_port 12345 main.py
,这里的main.py最好填写本地项目中main.py的绝对路径,否则大概率会出现找不到这个文件的错误,这里的main.py也是和服务器同步的
Environment variables:按照自己所需的GPU环境设置,CUDA_VISIBLE_DEVICES=0,1
然后就可以和平常一样设置断点调试了
更多推荐
所有评论(0)