ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

DW吃瓜课程——机器学习理论知识笔记(三)

2021-08-31 02:00:43  阅读:252  来源: 互联网

标签:结点 样本 划分 理论知识 吃瓜 类别 DW 决策树 属性


本篇是针对经典教材《机器学习》及DataWhale小组出版的配套工具书《机器学习公式详解》的学习笔记,主要以查缺补漏为主,因此对于一些自己已经熟悉的概念和内容不再进行整理。由于水平实在有限,不免产生谬误,欢迎读者多多批评指正。

第四章 决策树


基本概念

决策树一般包含根结点、内部结点和叶结点,其中前两者对应于某个属性/特征测试,而叶结点则对应决策结果(类别)。样本集自根结点输入后,会根据当前每个结点的属性预测结果分配到相应的子节点中。

图1

构建树的思路

决策树模型训练的本质就是选择合适的划分属性并以最优的方式将代表属性测试的结点组成一个树结构,训练的目标是得到一棵对未知样本划分效果好的决策树。

图2

决策树利用递归的方法完成构建,其基本流程如上图所示。当满足图中的三种情况时,我们将当前结点标为叶结点,并使递归返回,其中第一类情况意味着利用当前的属性划分已得到了一种单一类别的样本,则此叶结点标记为当前样本的类型(注意叶结点代表一种类型,而其他结点代表的是划分属性);第二类情况说明剩下的属性已对区分当前样本没有效果,因此叶结点的类别直接选为其所含样本中占比最多的类别;第三类情况说明当前的属性组合下没有对应的样本,此时将叶结点类别设定为其父结点所含样本最多的类别。当这些情况都没有出现时,当前节点就不是叶结点,我们会根据划分原则选择当前的最优划分属性,并对其属性的每个取值分支(也就是一个子树)再次调用判断函数(递归推进),直至所有结点都判断完毕。

划分属性的选择

(未完待续)

参考资料:

  1. 《机器学习》 周志华 著
  2. 《机器学习公式详解》 谢文睿 秦州 著
  3. https://www.bilibili.com/video/BV1Mh411e7VU?p=1 《机器学习公式详解》(南瓜书)与西瓜书公式推导直播合集

标签:结点,样本,划分,理论知识,吃瓜,类别,DW,决策树,属性
来源: https://www.cnblogs.com/liugd-2020/p/15208524.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有