Pytorch之深入理解torch.nn.Parameter()

先看一段代码：import torchimport torch.nn as nna=torch.tensor([1,2],dtype=torch.float32)print(a)print(nn.Parameter(a))print(nn.parameter.Parameter(a))结论：nn.Parameter=nn.parameter.Parameterparameter本质仍然是一个ten

音程

17432人浏览 · 2021-09-26 11:41:42

音程 · 2021-09-26 11:41:42 发布

先看一段代码：

import torch
import torch.nn as nn
a=torch.tensor([1,2],dtype=torch.float32)
print(a)
print(nn.Parameter(a))
print(nn.parameter.Parameter(a))

在这里插入图片描述

结论：

nn.Parameter=nn.parameter.Parameter
parameter本质仍然是一个tensor。
nn.Parameter的作用是：将一个不可训练的类型Tensor转换成可以训练的类型parameter，并且会向宿主模型注册该参数，成为一部分。即model.parameters()会包含这个parameter。从而，在参数优化的时候可以自动一起优化，这就不需要我们单独对这个参数进行优化啦。

其中2的证明如下：
在这里插入图片描述

补充

不少童鞋会想这个nn.Parameter(tensor)和对一个tensor直接进行`requires_grad=True`有什么区别？这两者不是一样的！即下面的w1和w2功能是不一样的：

#对一个tensor直接进行`requires_grad=True`
w1=torch.tensor([1,2],dtype=torch.float32,requires_grad=True)

#nn.Parameter(tensor)
a=torch.tensor([3,4],dtype=torch.float32)
w2=nn.Parameter(a)

功能哪里不一样？其实就是上面说的结论中的第3条，对一个tensor直接进行requires_grad=True确实也变成了可训练的tensor，但这个tensor无法像parameter那样自动包括在 model.parameters()中。

最后，我们做一个验证：

class mod(nn.Module):
    def __init__(self):
        super(mod,self).__init__()
        self.w1=torch.tensor([1,2],dtype=torch.float32,requires_grad=True)
        a=torch.tensor([3,4],dtype=torch.float32)
        self.w2=nn.Parameter(a)
    def forward(self,inputs):
        o1=torch.dot(self.w1,inputs)#使用了带梯度的普通tensor
        o2=torch.dot(self.w2,inputs)#使用了parameter
        return o1+o2

model=mod()
for p in model.parameters():
    print(p)

在这里插入图片描述
我们发现，只有parameter会在model.parameters()中，这意味这，w1参数需要手动单独优化。

补充：
上述好像只打印了参数，没有打印参数名称，有点low。高级的如下：

model.state_dict()
#或者
for para in model.named_parameters():
	print(para)

完

华为云开发者联盟

为开发者提供学习成长、分享交流、生态实践、资源工具等服务，帮助开发者快速成长。

更多推荐

如何基于香橙派AIpro对视频/图像数据进行预处理？

华为云开发者联盟

HAS2024：华为云以系统性创新加速千行万业智能化升级

华为云开发者联盟

数仓的两种轻量级数据交换格式：json与jsonb

华为云开发者联盟

所有评论(0)

查看更多评论

音程

@qq_43391414

已为社区贡献35条内容