分类与监督学习，朴素贝叶斯分类算法（带你理解朴素贝叶斯分类算法）-FinClip官网

分类与监督学习，朴素贝叶斯分类算法（带你理解朴素贝叶斯分类算法）

网友投稿 1365 2022-09-19

分类与监督学习，朴素贝叶斯分类算法（带你理解朴素贝叶斯分类算法）

(1)简述分类与聚类的联系与区别。

联系：两者都是对于想要分析的目标点，都会在数据集中寻找它最近的点，即二者都用到了NN算法。

区别：

分类：从机器学习的观点，分类技术是一种有指导的监督学习，即每个训练样本的数据对象已经有类标识，通过学习可以形成表达数据对象与类标识间对应的知识。

聚类：在机器学习中，聚类是一种无指导的无监督学习。也就是说，聚类是在预先不知道欲划分类的情况下，根据信息相似度原则进行信息聚类的一种方法。

(2)简述什么是监督学习与无监督学习。

监督学习：表示机器学习的数据是带标记的，这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果，不断修正机器的预测结果。

无监督学习：表示机器学习的数据是没有标记的。机器从无标记的数据中探索并推断出潜在的联系。

2.朴素贝叶斯分类算法实例

利用关于心脏病患者的临床历史数据集，建立朴素贝叶斯心脏病分类模型。

有六个分类变量(分类因子)：性别，年龄、KILLP评分、饮酒、吸烟、住院天数

目标分类变量疾病：

–心梗

–不稳定性心绞痛

新的实例：–(性别=‘男’，年龄<70, KILLP=‘I'，饮酒=‘是’，吸烟≈‘是”，住院天数<7)

最可能是哪个疾病？

上传手工演算过程。

性别

年龄

KILLP

饮酒

吸烟

住院天数

疾病

男

>80

是

7-14

心梗

女

70-80

否

是

心梗

女

70-81

否

不稳定性心绞痛

女

<70

否

是

>14

心梗

男

70-80

是

7-14

心梗

女

>80

否

7-14

心梗

男

70-80

否

7-14

心梗

女

70-80

否

7-14

心梗

女

70-80

否

心梗

男

<70

否

7-14

心梗

女

>80

否

是

心梗

女

70-80

否

是

7-14

心梗

女

>80

否

是

7-14

不稳定性心绞痛

男

70-80

是

>14

不稳定性心绞痛

女

<70

否

心梗

男

70-80

否

>14

心梗

男

<70

是

7-14

心梗

女

70-80

否

>14

心梗

男

70-80

否

7-14

心梗

女

<70

否

不稳定性心绞痛

朴素贝叶斯公式：

计算：

p(实例) = 8/20 * 5/20 * 10/20 * 4/20 * 9/20 * 6/20 = 54/40000

p(心梗 / 实例) = ( 7/16 * 4/16 * 9/16 * 3/16 * 7/16 * 4/16 ) * 16/20 / ( 54/40000 ) ≈ 75%

p(不稳定性心绞痛 / 实例) = ( 1/4 * 1/4 * 1/4 * 1/4 * 2/4 * 2/4 * 1/4 ) * 4/20 / (54 / 40000) ≈ 15%

由于p(心梗 / 实例) > p(不稳定性心绞痛 / 实例) ，所以该实例最可能患心梗

3.使用朴素贝叶斯模型对iris数据集进行花分类。

尝试使用3种不同类型的朴素贝叶斯：

高斯分布型

多项式型

伯努利型

并使用sklearn.model_selection.cross_val_score()，对各模型进行交叉验证。

##朴素贝叶斯算法

# 导入朴素贝叶斯模型

from sklearn.naive_bayes import GaussianNB, MultinomialNB, BernoulliNB

# 模型交叉验证

from sklearn.model_selection import cross_val_score

# 导入鸢尾花数据库

from sklearn.datasets import load_iris

# 导入鸢尾花数据集

iris = load_iris()

x = iris['data']

y = iris['target']

### 高斯分布型

# 构建模型

GNB_model = GaussianNB()

# 训练模型

GNB_model.fit(x, y)

# 预测模型

GNB_pre = GNB_model.predict(x)

print("高斯分布型:")

print("模型准确率：", sum(GNB_pre == y)/len(x))

# 模型交叉验证得分

GNB_score = cross_val_score(GNB_model, x, y, cv=10)

print("平均精度：%.2f\n" % GNB_score.mean())

### 多项式型

# 构建模型

MNB_model = MultinomialNB()

# 训练模型

MNB_model.fit(x, y)

# 预测模型

MNB_pre = MNB_model.predict(x)

print("多项式型:")

print("准确率：", sum(MNB_pre == y)/len(x))

# 模型交叉验证得分

MNB_score = cross_val_score(MNB_model, x, y, cv=10)

print("平均精度：%.2f\n" % MNB_score.mean())

### 伯努利型

BNB_model = BernoulliNB() # 构建模型

BNB_model.fit(x, y) # 训练模型

BNB_pre = BNB_model.predict(x) # 预测模型

print("伯努利型:")

print("模型准确率：", sum(BNB_pre == y)/len(x))

# 模型交叉验证得分

BNB_score = cross_val_score(BNB_model, x, y, cv=10)

print("平均精度：%.2f\n" % BNB_score.mean())

__EOF__

作　　者：Raicho

出　　处：https://cnblogs.com/lzhdonald

洞察纵观鸿蒙next版本，如何凭借FinClip加强小程序的跨平台管理，确保企业在数字化转型中的高效运营和数据安全？

1365 2022-09-19

分类与监督学习，朴素贝叶斯分类算法（带你理解朴素贝叶斯分类算法）

洞察纵观鸿蒙next版本，如何凭借FinClip加强小程序的跨平台管理，确保企业在数字化转型中的高效运营和数据安全？

洞察金融行业需要转型，如何利用鸿蒙app开发提升运营效率

洞察在数字化转型过程中，信创推动企业有效整合资源，实现低成本、高效率的跨平台小程序运营。

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计