Deep Learning【第二章】-FinClip官网

Deep Learning【第二章】

网友投稿 657 2022-09-29

Deep Learning【第二章】

文章目录

机器学习任务攻略类神经网络训练不起来怎么办

Local minima（局部最小值）与 saddle point（鞍点）batch 与 momentum

batchMomentum

自动调整学习率 (Learning Rate)

AdagradRMSPropAdam: RMSProp + Momentum

损失函数 (Loss)

机器学习任务攻略

注意：当 loss 在 training data 上就很大时，如果增加模型复杂度，但是 loss 并没有减少，大概率是 optimization 有问题。

减少模型复杂度，选择更简单更平滑的模型增加训练集数据减少参数或者共享参数减少 featureEarly stoppingRegularizationDropout

如何尽可能选出在未知的 testing data 上面表现更好的 model 可以加入验证集来选更好的 model，通常采用 N 折交叉验证来分割数据集并进行验证。

类神经网络训练不起来怎么办

optimization Fails because…

Local minima（局部最小值）与 saddle point（鞍点）

梯度为 0

当满足 critical point 时，grdient 为 0

例子：

当 critical point 是 saddle point（鞍点）时，可以通过 Hessian 来帮我们判断 update 的方向。

找特征值是负的对应的特征向量的方向，朝着此方向前进，就会使梯度减小。

一个点代表一个 network。纵轴代表训练停下时，Loss 的大小。横轴代表训练停下时，特征值为正的特征值占所有特征值的比率。

所以在高维空间中大多数都是鞍点而不是局部最小值。

batch 与 momentum

batch

为什么要用 batch：每个 batch 都可以更新一波参数

有并行运算时，batch size 大的可能训练一个 epoch 会更快。

但是在 batch size 小的 noise 对 optimization 可能有更好的结果。

小的 batch 对 training 更好可能的解释：

每次 batch 时对应的 loss function 有差异，对应的梯度有差异。

小 batch size 对 testing 更好：

Local minima 也有好坏之分，平原上的 Local minima 更好，峡谷中的 Local minima 更差，而大的 batch size 会更倾向于峡谷中的 Local minima。

因为小的 batch size 的 update 方向具有随机性，其更容易跳出 Sharp Minima。

Momentum

普通的 grident descent 在 update 时只会走梯度的反方向

加上 Momentum 后，update 时，会走梯度的此时梯度的反方向以及 momentum（前一步所走的方向）的和的反向。

而 momentum 就是之前所有的前进方向的和。

自动调整学习率 (Learning Rate)

当 Loss 不下降的时候，不一定卡到 critical point 处（很难走到 critical point）。

当 learning rate 为定植时，可能会出现上图两个问题（震荡与先正常然后走的特别慢）

我们要改一下 gradient descend 的式子，使得其在陡峭的地方 learning rate 小，平缓的地方 learning rate 大。

Adagrad

相当于如果 grident 大的话，σ 就大，σ 大的话，learning rate 就小了。

RMSProp

引入 α 来表示新算出来的 grident 所占的比重。

Adam: RMSProp + Momentum

引入 Adagrad

η 设置为一个随时间变化的函数，随时间的增加 η (learning rate) 越来越小。

Warm up (黑科技)

momentus 是为了增加历史运动的惯性，RMS 是为了缓和步伐的大小，变得更平缓

损失函数 (Loss)

当只有两个 class 时，一般采用 sigmoid ( 此时 sigmoid 跟 softmax 的作用等价)，而两个以上则用 softmax。

minimizing cross-entropy 就相当于 maximizing linklihood

用 Mean Square 处理 classify 问题，可能会卡住在 critical point。

微前端架构如何改变企业的开发模式与效率提升

657 2022-09-29

Deep Learning【第二章】

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计