Pytorch反向传播(loss.backward)报错原因及解决办法

RuntimeError: grad can be implicitly created only for scalar outputs 错误原因及其解决办法

卡卡南安

20048人浏览 · 2022-02-06 22:14:46

卡卡南安 · 2022-02-06 22:14:46 发布

报错信息

在程序中我的损失函数定义如下所示：

loss = nn.CrossEntropyLoss(reduction='none')

但在执行loss.backward()时出现了下面这条报错信息：

RuntimeError: grad can be implicitly created only for scalar outputs

原因分析

在定义损失函数loss时，我们设置了参数reduction='none'，这导致我们计算出的loss是一个二维的张量，行数为batchsize的大小。

backward只有对标量输出时才会计算梯度，而无法对张量计算梯度。

解决办法

将张量转变成一个标量，比如我们可以对loss求和，然后用求和得到的标量再反向传播求各个参数的梯度，这样不会对结果造成影响。

1.loss.backward 👉 loss.sum().backward 或者 loss.backward 👉 loss.backward(torch.ones_like(loss))

上面这两个方法表示对loss求和后再进行反向传播，其中第一个方法比较好理解，第二方法中的torch.ones_like(loss)是传入的grad_tensors参数，表示创建了一个与loss同样大小的全1张量，另loss与torch.ones_like(loss)点乘后再进行反向传播，也相当于对loss求和后再进行反向传播。

在这里插入图片描述