4 维张量在卷积神经网络中应用的非常广泛,它用于保存特征图(Feature maps)数据。
在这里插入图片描述
例如上图,images的输入格式为[2,3,200,250],这是一个4维张量。

格式一般定义为:

[b,c,h,w]

其中𝑏表示输入的数量,𝑐表示特征图的通道数,h、w分布表示特征图的高宽,部分深度学习框架也会使用[ h, w,c ]格式的特征图张量,例如PyTorch。图片数据是特征图的一种,对于含有RGB 3 个通道的彩色图片,每张图片包含了h 行w 列像素点,每个点需要3 个数值表示RGB 通道的颜色强度,因此一张图片可以表示为[h, w, 3]。如图所示,最上层的图片表示原图,它包含了下面3 个通道的强度信息。
参考链接:https://blog.csdn.net/python_LC_nohtyp/article/details/104097182

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐