图像处理之4维张量

4 维张量在卷积神经网络中应用的非常广泛，它用于保存特征图(Feature maps)数据。例如上图，images的输入格式为[2,3,200,250]，这是一个4维张量。格式定义格式一般定义为：[b,c,h,w]其中????表示输入的数量，????表示特征图的通道数,h、w分布表示特征图的高宽，部分深度学习框架也会使用[ ????, ℎ,w ]格式的特征图张量，例如PyTorch。图片数据是特征

Good@dz

8974人浏览 · 2021-05-06 14:25:14

Good@dz · 2021-05-06 14:25:14 发布

4 维张量在卷积神经网络中应用的非常广泛，它用于保存特征图(Feature maps)数据。
在这里插入图片描述
例如上图，images的输入格式为[2,3,200,250]，这是一个4维张量。

格式一般定义为：

[b,c,h,w]

其中𝑏表示输入的数量，𝑐表示特征图的通道数,h、w分布表示特征图的高宽，部分深度学习框架也会使用[ h, w,c ]格式的特征图张量，例如PyTorch。图片数据是特征图的一种，对于含有RGB 3 个通道的彩色图片，每张图片包含了h 行w 列像素点，每个点需要3 个数值表示RGB 通道的颜色强度，因此一张图片可以表示为[h, w, 3]。如图所示，最上层的图片表示原图，它包含了下面3 个通道的强度信息。
参考链接：https://blog.csdn.net/python_LC_nohtyp/article/details/104097182