Pytorch – RuntimeError: No rendezvous handler for env://错误
1 RuntimeError: No rendezvous handler for env://
今天在Windows上使用torch.nn.parallel.DistributedDataParallel进行单机多卡分布式训练出现RuntimeError: No rendezvous handler for env://错误。
出问题代码如下:
import torch.distributed as dist
dist.init_process_group(backend="gloo",
world_size=args.world_size,
rank=args.local_rank)
在上述代码中,我们没有对init_process_group
函数的参数init_method
进行设置,所以参数init_method
使用了默认值env://
,但是在windows上并不支持env://
,所以我们需要将代码调整如下:
import torch.distributed as dist
dist.init_process_group(backend="gloo",
world_size=args.world_size,
rank=args.local_rank,
init_method="file:///sharefile")
使用file:///sharefile
作为参数init_method
值即可消除RuntimeError: No rendezvous handler for env://
错误。
本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:Pytorch – RuntimeError: No rendezvous handler for env://错误
原文链接:https://www.stubbornhuang.com/2326/
发布于:2022年08月25日 8:37:11
修改于:2023年06月21日 18:12:22
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论
50