线性回归与逻辑回归 (logistic regression and linear regression)-FinClip官网

线性回归与逻辑回归 (logistic regression and linear regression)

网友投稿 849 2022-09-29

线性回归与逻辑回归 (logistic regression and linear regression)

文章目录

线性回归

Step 1: ModelStep 2: Goodness of FunctionStep 3: Gradient DescentHow's the results?Model SelectionBack to step 1: Redesign the ModelBack top step 2: RegularizationRegularization

逻辑回归

理想中定义分类任务的模型函数通过高斯分布来解决

Generative Model最大化 LikelihoodThree Steps

Naive Bayes ClassifierPosterior ProbilityStep 1: Function SetStep 2: Goodness of a FunctionStep 3: Find the best function

Cross Entropy vs Square ErrorDiscriminative vs GenerativeMulti-class ClassificationLimitation of Logistic Regression

线性回归一般用于数据预测，预测结果一般为实数。逻辑回归一般用于分类预测，预测结果一般为某类可能的概率。

线性回归

Step 1: Model

定义模型

Step 2: Goodness of Function

定义 Loss 函数，用于判断模型好坏，此处选取的 MSE

通过最小化 Loss 函数，来得到更好的模型

Step 3: Gradient Descent

通过梯度下降来优化参数

两个参数的梯度下降求法

可视化

How’s the results?

Model Selection

引入多次项，定义更复杂的 Model

当模型越复杂可能会出现 Overfitting 的情况

Back to step 1: Redesign the Model

重新定义模型，考虑物种对结果的影响

考虑其他 feature 对结果的影响，重新定义Model

Back top step 2: Regularization

对 Loss function 加入正则化来解决 Overfitting 问题

Regularization

正则化：期待参数越小的 function，越平滑，output 对输入的变化是比较不敏感的，可以对噪点不敏感。

逻辑回归

理想中定义分类任务的模型函数

通过高斯分布来解决

假设数据属于高斯分布（也可以假设属于其他分布，此处有主观意识影响），然后通过高斯模型来解决问题。

Generative Model

最大化 Likelihood

求出 μ 和 ∑

用了所有feature ，结果还是坏掉了

考虑给两个Model 公用 covariance matrix，这样就只需要较少的 parameters（不容易 overfitting）

求出 μ 和 ∑

发现公用 ∑ 后，此时的 boundary 是线性的，正确率提高了很多。

Three Steps

所以总结为以下 3 步：

Naive Bayes Classifier

假设所有的 feture 是 independent，其概率就可以表示为下面的形式，这种模型属于 Naive Bayes Classifier

Posterior Probility

分析 Posterior Probability

Step 1: Function Set

推出来的 σ 就是 sigmoid 函数，其图像表示如下：

用图可表示为如下形式：

Step 2: Goodness of a Function

这种 Loss 函数就是 cross entropy 代表的含义是两个 distribution 有多接近，越小越接近

Step 3: Find the best function

为什么逻辑回归不能采用 MSE 作为 Loss 函数？

Cross Entropy vs Square Error

如果逻辑回归问题用 square error 时，可能出现在远处梯度就为 0 的情况，而不能更新。

Discriminative vs Generative

Discriminative Model 就是直接定义函数，然后优化函数的 Model，让机器自己找 distribution。Generative Model 是先假设一个 distribution，然后再求出参数值 (μ 和 ∑) 带入 Model。

准确率有所不同

Generative Model 做了一些假设

举例：

此例子下用 Generative Model 得到 data1 的几率小于 0.5（因为 Navie Bayes Model 假设两个 feature 独立）

在 training data 少的时候，Generative Model 可能表现更好，不容易被噪点影响。

Multi-class Classification

多分类可以用如下模型解决softmax 也可以通过 Gaussain Model 推导出来

多分类问题 Loss 函数也可以用 Cross Entropy 定义

Limitation of Logistic Regression

下面这种情况逻辑回归解决起来很难。

所以我们可以考虑对特征 (feature) 进行转换，然后再用逻辑回归解决

可以将 logistic regression models 多个 cascading 起来，让机器自己找 feature transformation

机器找出来的情况如下：

可以把这些 Logistic Regression 叠在一起，某一个 Logistic Regression 可以是其他 Logistic Regression 的 output。

可以给这个 Model 一个新名字：Neural Network (Deep learning)

微前端架构如何改变企业的开发模式与效率提升

849 2022-09-29

线性回归与逻辑回归 (logistic regression and linear regression)

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计