洞察探索open banking如何通过小程序容器技术助力金融企业实现数据安全和数字化转型
838
2022-11-20
白话空间统计二十三:回归分析(一)
2017年开篇文章,还是继续是虾神我的老本行:白话空间统计。所以虾神准备直接就在一棵树上吊死算哒——将空间统计进行到底。
在这里简单做一下今年的更新计划:
1、续写白话空间统计,以及以前的一些文章重写(重写包括订正和内容重新编写),全年在白话空间统计这个系列上,更新的内容和订正的内容,大约是3:1左右。
2、R语言和Python的一些应用、包和Demo的介绍和教程(类似去年Leaflet for R那样的系列文章,全年应该有两至三个系列)。
3、翻译文章,包括教材系列的和国外文章系列的文章。
4、连载或者贴老夫做的一些PPT神马的。
那么全年预计更新60-70篇文章左右,每月5-6篇……好吧,写完这句话的时候,虾神就突然觉得背后冷飕飕的,一月都过去一半,就说明已经欠下三篇文章的账了啊……啊啊啊啊……好有危机感啊。
好吧,正式开始今天……今年的内容。
回归分析实际上是统计学里面的一个经典内容,关键是在空间统计里面,有一个巨大的拦路虎就是:地理回归分析,所以要讲地理回归分析,不得不先讲讲回归分析。
对于大部分人来说,回归分析就是这样的:
这应该是对于大部分非统计学背景的同学来说,最形象的说明了……一说回归分析,so,这个东东我知道,不就是一条直线么……至于这个直线是干嘛的——你问我我问谁呢?好吧,今天就让虾神来好好念叨念叨这跟直线是干嘛的。
他用的“回归”这个词,最早是用来研究同一族群中,父辈身高与子代身高之间的关系而提出来的,按照我们一般的遗传学常识,父亲高,儿子自然也高,父亲矮,儿子自然也矮,但是他发现了一个很有意思的现象:
如上图,在同一族群里面,子代的身高,会慢慢的回归族群的平均身高,虽然大方向上,还是高个子父亲生高个子儿子,但是他们与平均身高的距离会越来越小。所以,这个就是在统计学上,回归最早的含义。
当然,到了今天,回归分析已经变成了数据分析领域应用最广泛的分析方法(没有之一——什么?你说专题图是最广泛的?亲,那东西叫做可视化,不是分析方法……)
回归分析主要用来干嘛呢?
首先就是探索自变量和因变量之间的因果关系:
其次还可以通过自变量的取值来预测因变量的结果。比如美元和黄金问题。。。
还有一个最大的优点,就是回归可以用统计手段,排除在干扰因素……这个说起来好像很复杂,暂时挖一坑,回头待填。
好了,第一篇文章暂时就先到这里了,从下一篇文章开始正式讲回归分析……当然,从回归到地理回归,估计中间还有不少内容要讲,就当开了个专题吧。
2017年,一七……一起,我们一起成长。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~