关于pytorch相关部分矩阵变换函数的问题分析-FinClip官网

关于pytorch相关部分矩阵变换函数的问题分析

网友投稿 903 2022-10-19

关于pytorch相关部分矩阵变换函数的问题分析

目录1、tensor 维度顺序变换 BCHW顺序的调整2、矩阵乘法相关函数，矩阵乘，点乘3、求取矩阵对角线元素，或非对角线元素

1、tensor 维度顺序变换 BCHW顺序的调整

tensor.permute(dims)

将tensor的维度换位。参数是一系列的整数，代表原来张量的维度。比如三维就有0，1，2这些dimension。

import torch

a = torch.rand(8,256,256,3) #---> n,h,w,c

print(a.shape)

b = a.permute(0,3,1,2) # ---> n,c,h,w

print(b.shape)

#输出

torch.Size([8, 256, 256, 3])

torch.Size([8, 3, 256, 256])

numpy内进行维度顺序变换采用_numy.transpose(a,axis=None)_

参数 a: 输入数组

axis: int类型的列表，这个参数是可选的。默认情况下，反转的输入数组的维度，当给定这个参数时，按照这个参数所定的值进行数组变换。

返回值 p: ndarray 返回转置过后的原数组的视图。

import numpy as ?np

x = np.random.randn(8,256,256,3) ?# ---> n,h,w,c

print(x.shape)

y=x.transpose((0,3,1,2)) ? # ?----> n,c,h,w

print(y.shape)

#输出

(8, 256, 256, 3)

(8, 3, 256, 256)

2、矩阵乘法相关函数，矩阵乘，点乘

二维矩阵乘法torch.mm()

torch.mm(mat1,mat2,out=None),其中mat1(NXM)，mat2(MXD)，输出out的维度为(NXD)

该函数一般只用来计算两个二维矩阵的矩阵乘法，并且不支持broadcast操作。

三维带batch的矩阵乘法 torch.bmm()由于神经网络训练一般采用mini-batch，经常输入的时三维带batch的矩阵，所以提供torch.bmm(bmat1, bmat2, out=None)，其中bmat1(b×n×mb×n×m)，bmat2(b×m×db×m×d)，输出out的维度是(b×n×db×n×d)。

该函数的两个输入必须是三维矩阵且第一维相同（表示Batch维度），不支持broadcast操作。

多维矩阵乘法 torch.matmul()torch.matmul(input, other, out=None)支持broadcast操作，使用起来比较复杂。

针对多维数据 matmul()乘法http://，我们可以认为该matmul()乘法使用使用两个参数的后两个维度来计算，其他的维度都可以认为是batch维度。假设两个输入的维度分别是input(1000×500×99×111000×500×99×11), other(500×11×99500×11×99)那么我们可以认为torch.matmul(input, other, out=None)乘法首先是进行后两位矩阵乘法得到(99×11)×(11×99)(99×99)(99×11)×(11×99)(99×99) ，然后分析两个参数的batch size分别是 (1000×500)(1000×500) 和 500500 , 可以广播成为 (1000×500)(1000×500)，因此最终输出的维度是(1000×500×99×991000×500×99×99)。

矩阵逐元素(Element-wise)乘法 torch.mul()torch.mul(mat1, other, out=None)，其中other乘数可以是标量，也可以是任意维度的矩阵，只要满足最终相乘是可以broadcast的即可

@ ：矩阵乘法，自动执行适合的矩阵乘法函数* ：element-wise乘法

3、求取矩阵对角线元素，或非对角线元素

取对角线元素可以用torch.diagonal()

x = torch.randn(4,4)

# tensor([[ 0.9148, 0.1396, -0.8974, 2.0014],

# [ 0.1129, -0.3656, 0.4371, 0.2618],

# [ 1.1049, -0.0774, -0.4160, -0.4922],

# [ 1.3197, -0.2022, -0.0031, -1.3811]])

torch.diagonal(x)

# tensor([ 0.9148, -0.3656, -0.4160, -1.3811])

非对角线元素没有特定API，如果是求和，可以矩阵求和减去对角线元素和。

网上看到一个巧妙的非对角线元素方法

n, m = x.shape

assert n == m

x.flatten()[:-1].view(n-1,n+1)[:,1:].flatten()

# tensor([ 0.1396, -0.8974, 2.0014, 0.1129, 0.4371, 0.2618, 1.1049, -0.0774,

# -0.4922, 1.3197, -0.2022, -0.0031])

首先利用flatten()拉直向量，然后去掉最后一个元素，得到n^2 - 1个元素，然后构造为一个维度为[N-1, N+1]的矩阵。在这个矩阵中，之前所有的对角线元素全部出现在第1列，然后根据索引获取[:, 1:]元素，得到的就是原矩阵的非对角线元素。

智慧屏安装 app如何提升家庭娱乐与教育体验的关键工具

903 2022-10-19

关于pytorch相关部分矩阵变换函数的问题分析

app开发者平台在数字化时代的重要性与发展趋势解析

智慧屏第三方App安装如何提升用户体验与功能拓展

智慧屏安装 app如何提升家庭娱乐与教育体验的关键工具

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计