标签:dtreeviz 惊艳 GBDT 可视化 install pip 决策树
目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!),而GBDT的基分类器最常用的就是CART决策树!掌握决策树,对理解之后的GBDT、LightGBM都有大有裨益。
可视化的方式理解决策树,对深刻理解这个模型很有帮助。大家最熟知的决策树可视化实现方式是下面这种:
dot_data = export_graphviz(
clf,
out_file=None,
feature_names=df.columns[:-1],
class_names=["good", "bad"],
filled=True,
rounded=True,
special_characters=True,
)
graph2 = pydotplus.graph_from_dot_data(dot_data)
graph2.write_png("./pics/tree.png")
这种方法很好地展示了树的结构,但并不完美:
1、基尼系数会占用图中的空间,并且不利于解释
2、每个节点中各目标类别的样本数不够直观
今天向大家介绍一个更为惊艳的决策树可视化库——dtreeviz
,我们直接看几张效果图
dtreeviz
有以下特色:
- 利用有颜色的目标类别图例
- 叶子大小与该叶子中的样本数成正比
- 将≥和<用作边缘标签,看起来更清晰
- 决策节点利用堆叠直方图展示特征分布,每个目标类别都会用不同的颜色显示
- 在每个节点中各目标类别的样本数都用直方图的形式,这样可以提供更多信息
dtreeviz
同样依赖GraphViz,其安装配置方法可以参考我之前的文章(决策树的可视化)
GraphViz 搞定后,安装dtreeviz即可
pip install dtreeviz # install dtreeviz for sklearn
pip install dtreeviz[xgboost] # install XGBoost related dependency
pip install dtreeviz[pyspark] # install pyspark related dependency
pip install dtreeviz[lightgbm] # install LightGBM related dependency
使用也很简单
bingo
标签:dtreeviz,惊艳,GBDT,可视化,install,pip,决策树 来源: https://www.cnblogs.com/jpld/p/15676100.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。