解决：RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: “ca.fc1

1. 问题2. 分析3. 解决1. 问题在修改完Resnet网络结构（加入attention机制）后进行train,报错：2. 分析原因是预训练模型里面的参数模型和自己修改的网络参数不对应。先看加载预训练模型的代码def _resnet(arch, block, layers, pretrained,

蠕动的爬虫

17683人浏览 · 2021-02-13 11:00:40

蠕动的爬虫 · 2021-02-13 11:00:40 发布

1. 问题
2. 分析
3. 解决

1. 问题

在修改完Resnet网络结构（加入attention机制）后进行train,报错：
在这里插入图片描述

2. 分析

原因是预训练模型里面的参数模型和自己修改的网络参数不对应。
先看加载预训练模型的代码

def _resnet(arch, block, layers, pretrained, progress, **kwargs):
  model = ResNet(block, layers, **kwargs)#自己定义的model
  if pretrained:
    state_dict = load_state_dict_from_url(model_urls[arch], progress=progress)#预训练的model
    model.load_state_dict(state_dict)

  return model

其中调用model的load_state_dict方法用预训练的模型参数来初始化自己定义的新网络结构，这个方法就是PyTorch中通用的用一个模型的参数初始化另一个模型的层的操作。load_state_dict方法还有一个重要的参数是strict，该参数默认是True，表示预训练模型的层和自己定义的网络结构层严格对应相等（比如层名和维度）。
所以当我们修改了网络结构后，如果strict之为True的时候就会报错。

3. 解决

将strict的值设为False即可

def _resnet(arch, block, layers, pretrained, progress, **kwargs):
  model = ResNet(block, layers, **kwargs)#自己定义的model
  if pretrained:
    state_dict = load_state_dict_from_url(model_urls[arch], progress=progress)#预训练的model
    model.load_state_dict(state_dict, strict=False)
   
    """如果是加载本地下载好的预训练模型，就用torch.load()，再把strict设为False
    model.load_state_dict(torch.load("./resnet50-19c8e357.pth"),strict=False)
    """
  return model