Python LeNet网络详解及pytorch实现-FinClip官网

Python LeNet网络详解及pytorch实现

网友投稿 642 2022-09-08

Python LeNet网络详解及pytorch实现

LeNet主要用来进行手写字符的识别与分类，并在美国的银行中投入了使用。本文主要为大家详细介绍了LetNet以及通过pytorch实现LetNet，感兴趣的小伙伴可以学习一下

1.LeNet介绍

2.LetNet网络模型

3.pytorch实现LeNet

1.LeNet介绍

LeNet神经网络由深度学习三巨头之一的Yan LeCun提出，他同时也是卷积神经网络 (CNN，Convolutional Neural Networks)之父。LeNet主要用来进行手写字符的识别与分类，并在美国的银行中投入了使用。LeNet的实现确立了CNN的结构，现在神经网络中的许多内容在LeNet的网络结构中都能看到，例如卷积层，Pooling层，ReLU层。虽然LeNet早在20世纪90年代就已经提出了，但由于当时缺乏大规模的训练数据，计算机硬件的性能也较低，因此LeNet神经网络在处理复杂问题时效果并不理想。虽然LeNet网络结构比较简单，但是刚好适合神经网络的入门学习。

2.LetNet网络模型

LeNet网络模型一般指LeNet-5，相信大家学习这个模型的时候一定都见过这张图片吧

这张图也是原论文中的一张模型图，这样子看可能会觉得有点不习惯，下面这张图是本人在drawio软件上制作的网络模型图，如下:

纠正一下，上图中第二个Conv2d层后面的计算结果应该为10,写成了5

相信学习了卷积神经网络基础的朋友们应该能很清晰的看懂这张图吧，对于右边的计算在图的左上角也给出了公式，上图中每一层的输入形状以及输出形状我都详细的为大家写出来了，对于计算公式和模型大致的结构，看下面这张图也可以(建议对应上下图一起看更容易理解)

LeNet-5网络模型简单的就包含了卷积层，最大池化层，全连接层以及relu，softmax激活函数，模型中的输入图片大小以及每一层的卷积核个数，步长都是模型制定好的，一般不要随意修改，能改的是最后的输出结果，即分类数量(num_classes)。flatten操作也叫扁平化操作，我们都知道输入到全连接层中的是一个个的特征，及一维向量，但是卷积网络特征提取出来的特征矩阵并非一维，要送入全连接层，所以需要flatten操作将它展平成一维。

3.pytorch实现LeNet

python代码如下

from torch import nn

import torch

import torch.nn.functional as F

'''

说明:

1.LeNet是5层网络

2.nn.ReLU(inplace=True) 参数为True是为了从上层网络Conv2d中传递下来的tensor直接进行修改，这样能够节省运算内存，不用多存储其他变量

3.本模型的维度注释均省略了N(batch_size)的大小,即input(3, 32, 32)-->input(N, 3, 32, 32)

4.nn.init.xavier_uniform_(m.weight)

用一个均匀分布生成值,填充输入的张量或变量,结果张量中的值采样自U(-a, a)，

其中a = gain * sqrt( 2/(fan_in + fan_out))* sqrt(3),

gain是可选的缩放因子,默认为1

'fan_in'保留前向传播时权值方差的量级,'fan_out'保留反向传播时的量级

5.nn.init.constant_(m.bias, 0)

为所有维度tensor填充一个常量0

'''

class LeNet(nn.Module):

def __init__(self, num_classes=10, init_weights=False):

super(LeNet, self).__init__()

self.conv1 = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=5, stride=1)

self.maxpool1 = nn.MaxPool2d(kernel_size=2, stride=2)

self.relu = nn.ReLU(True)

self.conv2 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=5, stride=1)

self.maxpool2 = nn.MaxPool2d(kernel_size=2, stride=2)

self.fc1 = nn.Linear(32 * 5 * 5, 120)

self.fc2 = nn.Linear(120, 84)

self.fc3 = nn.Linear(84, num_classes)

if init_weights:

self._initialize_weights()

def forward(self, x):

x = self.conv1(x) # input(3, 32, 32) output(16, 28, 28)

x = self.relu(x) # 激活函数

x = self.maxpool1(x) # output(16, 14, 14)

x = self.conv2(x) # output(32, 10, 10)

x = self.relu(x) # 激活函数

x = self.maxpool2(x) # output(32, 5, 5)

x = torch.flatten(x, start_dim=1) # output(32*5*5) N代表batch_size

x = self.fc1(x) # output(120)

x = self.relu(x) # 激活函数

x = self.fc2(x) # output(84)

x = self.relu(x) # 激活函数

x = self.fc3(x) # output(num_classes)

return x

def _initialize_weights(self):

for m in self.modules():

if isinstance(m, nn.Conv2d):

nn.init.xavier_uniform_(m.weight)

if m.bias is not None:

nn.init.constant_(m.bias, 0)

elif isinstance(m, nn.Linear):

nn.init.xavier_uniform_(m.weight)

nn.init.constant_(m.bias, 0)

或者

下面这一种没有自己初始化权重和偏置，就会使用默认的初始化方式

import torch.nn as nn

import torch.nn.functional as F

import torch

class LeNet(nn.Module):

def __init__(self):

super(LeNet, self).__init__()

self.conv1 = nn.Conv2d(3, 16, 5)

self.pool1 = nn.MaxPool2d(2, 2)

self.conv2 = nn.Conv2d(16, 32, 5)

self.pool2 = nn.MaxPool2d(2, 2)

self.fc1 = nn.Linear(32*5*5, 120)

self.fc2 = nn.Linear(120, 84)

self.fc3 = nn.Linear(84, 10)

def forward(self, x):

x = F.relu(self.conv1(x)) # output(16, 28, 28)

x = self.pool1(x) # output(16, 14, 14)

x = F.relu(self.conv2(x)) # output(32, 10, 10)

x = self.pool2(x) # output(32, 5, 5)

x = x.view(x.size(0), -1) # output(32*5*5)

x = F.relu(self.fc1(x)) # output(120)

x = F.relu(self.fc2(x)) # output(84)

x = self.fc3(x) # output(10)

return x

nn.Linear就是全连接层，除了最后一个全连接层，其它均需要relu激活，默认无padding操作

nn.Conv2d对应的参数顺序一定要记住:

1.in_channels:输入的通道数或者深度

2.out_channels:输出的通道数或者深度

3.kernel_size:卷积核的大小

4.stride:步长大小,默认1

5.padding:padding的大小,默认0

6.dilation:膨胀大小,默认1，暂时用不到

7.group:分组组数，默认1

8.bias:默认True，布尔值，是否用偏置值

9.padding_mode:默认用0填充

记不住参数顺序也没关系，但需要记住参数名称

微前端架构如何改变企业的开发模式与效率提升

642 2022-09-08

Python LeNet网络详解及pytorch实现

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计