F.pad() 是pytorch 内置的 tensor 扩充函数,便于对数据集图像或中间层特征进行维度扩充,官方定义如下:

torch.nn.functional.pad (input, pad, mode=‘constant’, value=0)

  • input:需要扩充的 tensor,可以是图像数据,亦或是特征矩阵数据;
  • pad:扩充维度,预先定义某维度上的扩充参数;
  • mode:扩充方法,有三种模式,分别表示常量(constant),反射(reflect),复制(replicate);
  • value:扩充时指定补充值,value只在mode=constant有效,即使用value填充在扩充出的新维度位置,而在reflect和replicate模式下,value不可赋值;
一维度填充

参数pad只定义两个参数,表示只对输入矩阵的最后一个维度进行扩充

t4d = torch.empty(1, 3,5 ,3)
print(t4d.size())  # torch.Size([1, 3, 5, 3])
p1d = (1, 2)  # (左边填充数, 右边填充数)
t1 = F.pad(t4d, p1d, 'constant', 1)
print(t1.size())  # torch.Size([1, 3, 5, 6])
二维度填充

参数pad定义了四个参数,表示对输入矩阵的后两个维度进行扩充

p2d = (1, 2, 3, 4)  # (左边填充数, 右边填充数, 上边填充数, 下边填充数)
t2 = F.pad(t4d, p2d, 'constant', 2)
print(t2.size())  # torch.Size([1, 3, 12, 6])
三维度填充

参数pad定义了六个参数,表示对输入矩阵的后三个维度进行扩充

p3d = (1, 2, 3, 4, 5, 6)
t3 = F.pad(t4d, p3d, 'constant', 3)
print(t3.size())  # torch.Size([1, 14, 12, 6])
小结

  简单用一个图来表述F.pad()的应用。

【转载自】:F.pad 的理解

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐