微信小程序本地存储与登录页面处理实例详细讲解
686
2022-10-23
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
目录
基于mpg数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
# 1、定义数据集
# 2、数据集预处理
# 3、模型建立和训练
# 3.1、数据集切分
# 4、对模型进行PFI可视化
# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差
# T2、基于模型度量的解释—PFI置换特征重要性并可视化
基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
# 1、定义数据集
mpg | cylinders | displacement | horsepower | weight | acceleration | model_year | origin | name |
18 | 8 | 307 | 130 | 3504 | 12 | 70 | usa | chevrolet chevelle malibu |
15 | 8 | 350 | 165 | 3693 | 11.5 | 70 | usa | buick skylark 320 |
18 | 8 | 318 | 150 | 3436 | 11 | 70 | usa | plymouth satellite |
16 | 8 | 304 | 150 | 3433 | 12 | 70 | usa | amc rebel sst |
17 | 8 | 302 | 140 | 3449 | 10.5 | 70 | usa | ford torino |
# 2、数据集预处理
before (398, 9) mpg cylinders displacement ... model_year origin name0 18.0 8 307.0 ... 70 usa chevrolet chevelle malibu1 15.0 8 350.0 ... 70 usa buick skylark 3202 18.0 8 318.0 ... 70 usa plymouth satellite3 16.0 8 304.0 ... 70 usa amc rebel sst4 17.0 8 302.0 ... 70 usa ford torino[5 rows x 9 columns]after dropna and drop (392, 8) mpg cylinders displacement ... acceleration model_year origin0 18.0 8 307.0 ... 12.0 70 usa1 15.0 8 350.0 ... 11.5 70 usa2 18.0 8 318.0 ... 11.0 70 usa3 16.0 8 304.0 ... 12.0 70 usa4 17.0 8 302.0 ... 10.5 70 usa
# 3、模型建立和训练
# 3.1、数据集切分
X_feature_ns: ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model_year']
# 4、对模型进行PFI可视化
# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差
Weight | Feature |
---|---|
0.2846 ± 0.2878 | displacement |
0.1770 ± 0.2423 | weight |
0.1604 ± 0.1535 | horsepower |
0.1397 ± 0.1684 | mpg |
0.1085 ± 0.0800 | acceleration |
0.0715 ± 0.0545 | model_year |
0.0583 ± 0.1736 | cylinders |
# T2、基于模型度量的解释—PFI置换特征重要性并可视化
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~