@

目录

  • 前言
  • 三维情况
  • 变化一:不改变任何参数
  • 变化二:1与2交换
  • 变化三:0与1交换
  • 变化四:0与2交换
  • 变化五:0与1交换,1与2交换
  • 变化六:0与1交换,0与2交换
  • 总结
  • 写在最后

前言

本文只讨论二维三维中的permute用法

最近的Attention学习中的一个permute函数让我不理解

这个光说太抽象

我就结合代码与图片解释一下

首先创建一个三维数组小实例

import torch

x = torch.linspace(1, 30, steps=30).view(3,2,5)     # 设置一个三维数组
print(x)
print(x.size())                # 查看数组的维数

这里为了防止出现维数数值相同的巧合局面(例如三维数组(3,3,3)或者(2,4,4)等)

输出结果如下图

在这里插入图片描述

一般的把(3,2,5)解释为3维2行5列这里很容易让人迷迷糊糊

那么我们按照块,行,列理解起来会更容易一些

比如(3,2,5),表示3块 2*5的数组

以下我简单用3块3*3图偷懒举例

在这里插入图片描述


然后堆起来就是我们熟知的三维矩阵

在这里插入图片描述

接下来先简单介绍下permute()函数

permute(dims)
参数dims用矩阵的维数代入,一般默认从0开始。即第0维,第1维等等
也可以理解为,第0块,第1块等等。当然矩阵最少是两维才能使用permute
如是两维,dims分别为是0和1
可以写成permute(0,1)这里不做任何变化,维数与之前相同
如果写成permute(1,0)得到的就是矩阵的转置
如果三维是permute(0,1,2)
0代表共有几块维度:本例中0对应着3块矩阵
1代表每一块中有多少行:本例中1对应着每块有2行
2代表每一块中有多少列:本例中2对应着每块有5列
所以是3块2行5列的三维矩阵
这些0,1,2并没有任何实际的意义,也不是数值,只是用来标识区别。有点类似于x,y,z来区分三个坐标维度,是人为规定好的
三维情况直接用下面的代码来给大家讲解

三维情况

变化一:不改变任何参数
b = x.permute(0,1,2)            # 不改变维度
print(b)
print(b.size())

在这里插入图片描述

发现此时矩阵没有变化,依然是按照之前的方式排列

变化二:1与2交换
b = x.permute(0,2,1)             # 每一块的行与列进行交换,即每一块做转置行为
print(b)
print(b.size())

在这里插入图片描述

在这里插入图片描述

两张图片可以比较

在不改变每一块(即)的前提下,对每一块的行列进行对调(即二维矩阵的转置)

变化三:0与1交换
b = x.permute(1,0,2)            # 交换块和行
print(b)
print(b.size())

在这里插入图片描述

在这里插入图片描述

两者比较可以看出块数和每块的行数发生了变化

即参数0对应的数值3块变成2块

参数1对应的2行变成3行

这个变化刚好是0与1 的位置交换,导致参数进行对调

此时变成了2块 * 3行 * 5列(初始为3块 * 2行 *5列)

变化四:0与2交换
b = x.permute(2,1,0)            # 交换块和列
print(b)
print(b.size())

在这里插入图片描述

在这里插入图片描述

此时参数0对应的3块经过permute已经变成了5块
参数2对应的5列已经变成了3列

变化五:0与1交换,1与2交换
b = x.permute(2,0,1)            # 交换块和行和列
print(b)
print(b.size())

在这里插入图片描述


在这里插入图片描述


此时参数0对应的3块变成了5块
参数1对应的2行变成了3行
参数2对应的5列变成了2列

变化六:0与1交换,0与2交换
b = x.permute(1,2,0)            # 交换块和行和列
print(b)
print(b.size())

在这里插入图片描述

在这里插入图片描述


此时参数0对应的3块变成了2块
参数1对应的2行变成了5行
参数2对应的5列变成了3列

总结

根据以上举得二维和三维例子可以知道permute()函数其实是对矩阵的块行列进行交换

里面的参数并不是具体数值

而是块行列的代指

写在最后

没想随手写的一篇居然这么多读者关注

我又在此篇文章的基础上,详细的解释了维度变化过程

能够更好的帮助大家理解permute函数的用法

进阶文章请戳我

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐