当前位置：自学咖网 > 技术教程 > 编程最新 > pyspark GBTRegressor 特征重要度及排序

wen 编程最新 2024-01-31

pyspark GBTRegressor 特征重要度及排序

和随机森林类似，模型评估指标和特征重要度分析

训练好model 可用如下代码打印特征以及重要度排序

#打印特征索引及其重要度
features_important = model.featureImportances
print(features_important)

#获取各个特征在模型中的重要性并按照权重倒序打印
ks = list(features_important.indices)
vs = list(features_important.toArray())

features_important = tuple(features_important)
print(len(features_important))


name_index = train.schema["features"].metadata["ml_attr"]["attrs"]


index_im = zip(ks, vs)
names = []
idxs = []
 
fea_num = 0

for it in name_index[‘numeric‘]:
    names.append(it[‘name‘])
    idxs.append(it[‘idx‘])
    fea_num += 1
    
print (fea_num)

d = zip(names, idxs)
p = zip(index_im, d)
 
kv = {}
for fir, sec in p:
    kv[sec[0]] = fir[1]
    fea_num += 1
print(len(kv))
print (sorted(kv.items(), key=lambda el: el[1], reverse=True))

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » pyspark GBTRegressor 特征重要度及排序

wen 普通

分享到：

相关推荐

Golang项目的配置管理——Viper简易入门配置

Golang项目的配置管理——Viper简易入门配置 What is Viper？ From：https://github.com/spf13/viper Viper is a complete configuratio...

编程最新 2024-01-31
148

springboot中如何使用log4j制作统一的请求日志呢？

转自:http://www.java265.com/JavaCourse/202201/2144.html 下文笔者讲述springboot中使用log4j处理请求日志的方法分享，如下所示: 在日常项目中，我们经常需为一...

编程最新 2024-01-31
113

Netty 简易实战，傻瓜都能看懂！

作者：rickiyang 出处：www.cnblogs.com/rickiyang/p/11074237.html 这一节我们来讲解Netty，使用Netty之前我们先了解一下Netty能做什么，无为而学，岂不是白费力气...

编程最新 2024-01-31
114

祖传代码如何优化性能？

hello大家好呀，我是小楼~ 今天又带来一次性能优化的分享，这是我刚进公司时接手的祖传（坏笑）项目，这个项目在我的文章中屡次被提及，我在它上面做了很多的性能优化，比如《记一次提升18倍的性能优化》这篇文章，比较偏向某个...

编程最新 2024-01-31
206

Centos7安装python3、numpy、scipy、matplotlib、pandas等

centos 7 已经自带 python 2.7.15，这里需要安装 python 3 [[email protected]]# pythonPython 2.7.15 |Anaconda, Inc.| (de...

编程最新 2024-01-31
129

基础知识：DFRduino UNO R3最全资料详解

DFRduino UNO R3是一块基与开放原始代码的Simple i/o平台，並且具有使用类似java,C语言的开发环境。

编程最新 2024-01-31
108

自学咖网