Torch.nn模块学习-池化-FinClip官网

Torch.nn模块学习-池化

网友投稿 807 2022-11-28

Torch.nn模块学习-池化

池化对数据启到了浓缩的效果，通过池化可以减少数据量，降低内存压力。简单地理解，池化操作就是通过池化的kernel选取一定的区域，通过某种计算将这个区域的一系列数值转化为一个数值，需要注意的是，对于池化操作来说，池化的步长一般是卷积核的大小。

Pytorch中提供了多种池化的类，最大池化、平均池化、最大自适应池化等操作，下面以二维数据的处理为例，列出常用的池化操作。

对应的类	功能
.MaxPool2d()	针对输入信号上应用2d最大值池化
.MaxUnPool2d()	2d最大值池化的逆操作
.AvgPool2d()	输入信号上应用2d平均池化
.AdaptiveMaxPool2d()	2d自适应最大值池化（输出信号的大小自行指定）
.AdaptiveAvgPool2d()	2d自适应最大值池化（输出信号的大小自行指定）

以torch.nn.MaxPool2d为例进行说明：

torch.nn.MaxPool2d(kernel_size, stride=None,dilation=1,return_indices=False,ceil_mode=False)

参数的使用说明：

kernel_size: 最大池化的窗口大小stride: 最大池化窗口移动的大小，默认值为kernel_sizepadding: 输入信号中每一边补充0的层数dilation: 控制窗口中元素步幅的参数return_indices: 如果为True，则会返回输出最大值的索引，方便之后执行逆操作ceil_mode: True为向上取整，默认是向下取整

输入：（N，C-in， H-in， W-in）

输出：（N，C-out，H-out，W-out）

import torchimport torch.nn as nnimport matplotlib.pyplot as pltfrom PIL import Imageimport numpy as np# 读取图片转化为灰度图，并转化为numpy数组img = Image.open("imgs/lufei.jpg")img_gray = np.array(img.convert("L"), dtype=np.float32)# plt.figure(figsize=(6, 6))# plt.imshow(img_gray, cmap=plt.cm.gray)# plt.axis("off")# plt.show()# 将数组转化为张量imh, imw = img_gray.shapeimg_tensor = torch.from_numpy(img_gray.reshape(1, 1, imh, imw))# 使用5*5的随机数构成的卷积核进行卷积操作# 这里的卷积核是个比较神奇的卷积核，中间的数值比较大，两边的数值比较小kernel_size = 5kernel = torch.ones(kernel_size, kernel_size, dtype=torch.float32) * -1kernel[2, 2] = 24kernel = kernel.reshape((1, 1, kernel_size, kernel_size))# 进行卷积操作conv2d = nn.Conv2d(1, 2, (kernel_size, kernel_size), bias=False)conv2d.weight.data[0] = kernelimgconv2dout = conv2d(img_tensor)# 进行维度的压缩，这样图像才能展示出来imgconv2dout_img = imgconv2dout.data.squeeze()print("卷积之后的尺寸为：{}".format(imgconv2dout_img.shape))# 对卷积之后的张量进行最大池化，也就是锐化的操作maxpool2d = nn.MaxPool2d(2, stride=2)pool2_out = maxpool2d(imgconv2dout)pool2_out_im = pool2_out.squeeze()print(pool2_out.shape)# 可视化最大池化的结果plt.figure(figsize=(12, 6))plt.subplot(1, 2, 1)plt.imshow(pool2_out_im[0].data, cmap=plt.cm.gray)plt.axis('off')plt.subplot(1, 2, 2)plt.imshow(pool2_out_im[1].data, cmap=plt.cm.gray)plt.axis('off')plt.show()# 对卷积之后的张量进行平均g池化，也就是锐化的操作avgpool2d = nn.AvgPool2d(2, stride=2)pool2_out = avgpool2d(imgconv2dout)pool2_out_im = pool2_out.squeeze()print(pool2_out.shape)# 可视化最大池化的结果plt.figure(figsize=(12, 6))plt.subplot(1, 2, 1)plt.imshow(pool2_out_im[0].data, cmap=plt.cm.gray)plt.axis('off')plt.subplot(1, 2, 2)plt.imshow(pool2_out_im[1].data, cmap=plt.cm.gray)plt.axis('off')plt.show()# 对卷积之后的张量进行平均g池化，也就是锐化的操作adaavgpool2d = nn.AdaptiveAvgPool2d(output_size=(100, 100))pool2_out = adaavgpool2d(imgconv2dout)pool2_out_im = pool2_out.squeeze()print(pool2_out.shape)# 可视化最大池化的结果plt.figure(figsize=(12, 6))plt.subplot(1, 2, 1)plt.imshow(pool2_out_im[0].data, cmap=plt.cm.gray)plt.axis('off')plt.subplot(1, 2, 2)plt.imshow(pool2_out_im[1].data, cmap=plt.cm.gray)plt.axis('off')plt.show()

最大池化的结果：

平均池化的结果：

自适应池化的结果，图片变模糊了，尺寸变小了

微前端架构如何改变企业的开发模式与效率提升

807 2022-11-28

Torch.nn模块学习-池化

react 前端框架如何驱动企业数字化转型与创新发展

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计