PyTorch 中的 tensordot 以及 einsum 函数介绍-FinClip官网

PyTorch 中的 tensordot 以及 einsum 函数介绍

网友投稿 1191 2022-10-12

PyTorch 中的 tensordot 以及 einsum 函数介绍

文章目录

PyTorch 中的 tensordot 以及 einsum 函数介绍

前言广而告之从例子出发灵魂画手参考资料

前言

最近发现这两个函数用得越来越频繁, 比如在 DCN 网络的实现中就用到了(详见 Deep Cross Network (深度交叉网络, DCN) 介绍与代码分析), 但是过段时间又忘记这两个函数到底实现啥功能, 趁着现在印象还比较深刻的时候记录一下 ----.

广而告之

从例子出发

拿一大串中文或英文来形容这两个函数, 该懵逼的还是懵逼, 从例子出发可以很容易理解它们的具体功能. 例子来自 Stackoverflow: product-of-pytorch-tensors-along-arbitrary-axes.

import torchimport numpy as npa = np.arange(36.).reshape(3,4,3)b = np.arange(24.).reshape(4,3,2)c = np.tensordot(a, b, axes=([1,0], [0,1]))print(c)# [[ 2640. 2838.] [ 2772. 2982.] [ 2904. 3126.]]a = torch.from_numpy(a)b = torch.from_numpy(b)c = torch.einsum("ijk,jil->kl", (a, b))print(c)# tensor([[ 2640., 2838.], [ 2772., 2982.], [ 2904., 3126.]], dtype=torch.float64)

从例子中可以发现, einsum 同样可以实现 tensordot 的功能. 但现在的问题是, c 等于

[[ 2640. 2838.] [ 2772. 2982.] [ 2904. 3126.]]

这个结果具体是怎么得到的 ?

在 numpy.tensordot 文档中, 对 tensordot 的功能解释为:

Compute tensor dot product along specified axes

上面代码中, 在计算 c 时, 指定了 axes:

c = np.tensordot(a, b, axes=([1,0], [0,1]))

其中 a 用来参与计算的轴为 [1, 0], 由于 a.shape = (3, 4, 3), 那么用来参与计算的子数组 A 大小为 (4, 3); 对于 b 来说, 用来参与计算的轴为 [0, 1], 由于 b.shape = (4, 3, 2), 那么用来参与计算的子数组 B 大小为 (4, 3); 最后进行子数组(tensor)间的 dot product, 即 sum(A * B), 得到一个 scalar, 注意 * 是 element-wise 的乘法, 而不是矩阵乘法. 经过 tensordot 后, a 还保留着第 3 个维度, 大小为 a.shape[2] = 3, 而 b 也保留着第 3 个维度, 大小为 b.shape[2] = 2, 此时 c 的大小为 (a.shape[2], b.shape[2]) = (3, 2).

经过以上分析, 我们现在换种思路来计算 c, 代码如下:

import numpy as npa = np.arange(36.).reshape(3,4,3)b = np.arange(24.).reshape(4,3,2)aa = a.transpose((2, 1, 0)) ## aa.shape = (3, 4, 3)bb = b.transpose((2, 0, 1)) ## bb.shape = (2, 4, 3)print(np.sum(aa[0], bb[0]))# 2640.0cc = [ [np.sum(aa[0] * bb[0]), np.sum(aa[0] * bb[1])], [np.sum(aa[1] * bb[0]), np.sum(aa[1] * bb[1])], [np.sum(aa[2] * bb[0]), np.sum(aa[2] * bb[1])] ]print(cc)[[2640.0, 2838.0], [2772.0, 2982.0], [2904.0, 3126.0]]

因此, tensordot 的作用是将 axes 指定的子数组进行点乘, axes 指定具体的维度.

einsum 的用法非常丰富, 下面参考资料中的例子无不显示着这个函数的强大:

Stackoverflow: understanding-pytorch-einsumeinsum满足你一切需要：深度学习中的爱因斯坦求和约定

经过上面的分析, 可以发现 enisum 可以完成 tensordot 的功能, 即:

c = torch.einsum("ijk,jil->kl", (a, b))

用指定的字符串 "ijk,jil->kl" 就能形象地说明运算的目的.

灵魂画手

再说明一下 transpose. 它和 reshape 不一样, 我觉得它是改变观看 tensor 的视角. 比如对于如下矩阵:

(需要一点空间想象 ----)

参考资料

Stackoverflow: understanding-pytorch-einsum 例子相当丰富einsum满足你一切需要：深度学习中的爱因斯坦求和约定我只是想学习下中文表达~numpy.tensordot Numpy 的 tensordot 文档Stackoverflow: understanding-tensordot 解释的很通俗Stackoverflow: product-of-pytorch-tensors-along-arbitrary-axes 本文第一个例子的出处

轻量级前端框架助力开发者提升项目效率与性能

1191 2022-10-12

PyTorch 中的 tensordot 以及 einsum 函数介绍

轻量级前端框架助力开发者提升项目效率与性能

大屏前端框架如何推动企业数据可视化与用户体验的革新

探索flutter框架开发的app在移动应用市场的潜力与挑战

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计