解决:RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: “ca.fc1
1. 问题2. 分析3. 解决1. 问题在修改完Resnet网络结构(加入attention机制)后进行train,报错:2. 分析 原因是预训练模型里面的参数模型和自己修改的网络参数不对应。 先看加载预训练模型的代码def _resnet(arch, block, layers, pretrained,
·
1. 问题
在修改完Resnet网络结构(加入attention机制)后进行train,报错:
2. 分析
原因是预训练模型里面的参数模型和自己修改的网络参数不对应。
先看加载预训练模型的代码
def _resnet(arch, block, layers, pretrained, progress, **kwargs):
model = ResNet(block, layers, **kwargs)#自己定义的model
if pretrained:
state_dict = load_state_dict_from_url(model_urls[arch], progress=progress)#预训练的model
model.load_state_dict(state_dict)
return model
其中调用model的load_state_dict
方法用预训练的模型参数来初始化自己定义的新网络结构,这个方法就是PyTorch中通用的用一个模型的参数初始化另一个模型的层的操作。load_state_dict方法还有一个重要的参数是strict
,该参数默认是True,表示预训练模型的层和自己定义的网络结构层严格对应相等(比如层名和维度)。
所以当我们修改了网络结构后,如果strict之为True的时候就会报错。
3. 解决
- 将strict的值设为False即可
def _resnet(arch, block, layers, pretrained, progress, **kwargs):
model = ResNet(block, layers, **kwargs)#自己定义的model
if pretrained:
state_dict = load_state_dict_from_url(model_urls[arch], progress=progress)#预训练的model
model.load_state_dict(state_dict, strict=False)
"""如果是加载本地下载好的预训练模型,就用torch.load(),再把strict设为False
model.load_state_dict(torch.load("./resnet50-19c8e357.pth"),strict=False)
"""
return model
更多推荐
所有评论(0)