nn.linear()函数

import torchimport torch.nn as nnimport torch.nn.functional as Fclass LinearFC(nn.Module):def __init__(self):super(DropoutFC, self).__init__()self.fc = nn.Linear(3, 2)def forward(self, input):out = se

vincent_duan

7175人浏览 · 2021-08-26 17:21:11

vincent_duan · 2021-08-26 17:21:11 发布

import torch
import torch.nn as nn
import torch.nn.functional as F

class LinearFC(nn.Module):

    def __init__(self):
        super(DropoutFC, self).__init__()
        self.fc = nn.Linear(3, 2)

    def forward(self, input):
        out = self.fc(input)
        return out

Net = LinearFC()
x = torch.randint(10, (2, 3)).float()  # 随机生成不大于10的整数，转为float, 因为nn.linear需要float类型数据
Net.train()
output = Net(x)
print(output)

# train the Net

创建了一个最简单的LinearFC模型，里面有一个线性函数nn.Linear(3, 2)，线性变换公式为： $y=x W^T + b$ 。

通过Debug，一步一步查看运行情况：

在这里插入图片描述

当前这一步可以看到模型给我们随机初始化了权重 $W2×3W_{2 \times 3}$ 和偏置 $b2×3b_{2 \times 3}$ ，为什么权重 $W$ 的shape是 $2×32\times3$ ，因为公式里需要转置。

$x$ 随机生成不大于10的整数，转为float, 因为nn.linear需要float类型数据。
在这里插入图片描述
可以看出使用模型算出来的output，与手动使用公式算出来的结果一致。

Net.train()的作用

当网络中有 dropout，Batch Normalization 的时候。训练的要记得 Net.train(), 测试要记得 Net.eval()。

在训练模型时会在前面加上：

Net.train()

在测试模型时在前面使用：

model.eval()

同时发现，如果不写这两个程序也可以运行，这是因为这两个方法是针对在网络训练和测试时采用不同方式的情况，比如Batch Normalization 和 Dropout。

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

2025 CCF中国软件大会（CCF ChinaSoft）智能化研发智能体技术论坛成功召开

华为开发者空间

cover

【案例共创】基于华为云MaaS和开源Agent框架Dify.AI构建聊天助手

华为开发者空间

cover

基于远程开发环境部署Django与开发者空间GaussDB的实践应用

华为开发者空间

所有评论(0)

查看更多评论

vincent_duan

已为社区贡献13条内容