全文共2874字,预计学习时长8分钟
图源:unsplash
就像树木是人类生活的重要组成部分一样,基于树的算法也是机器学习的重要组成部分。树的结构给了我们开发算法的灵感,并再将其反馈到机器,让它们学习我们希望它们学习的东西,以解决现实生活中的问题。
这些基于树的学习算法被认为是最好和最常用的监督学习方法之一:决策树、随机森林、梯度提升等方法在各种数据科学问题中得到了广泛应用。对于每一个机器学习的初学者来说,学习这些算法并将其用于建模非常重要。
决策树是什么?
决策树是一种带有节点的树状图,节点表示我们选取一个属性并提出问题,边表示问题的答案,叶表示实际输出或类标签。它们被用于具有简单线性决策面的非线性决策。
决策树对例子进行分类,方法是将它们从树的根排序到某个叶节点,叶节点为例子进行分类。树中的每个节点作为某个属性的测试用例,从该节点下行的每条边都对应于测试用例的可能答案之一。这个过程本质上属于递归性质,并且对于每一个扎根于新节点的子树都要重复进行。
现实生活中的决策树
你肯定在生活中使用过决策树来做决定。举个例子,决定是否要在某天和孩子一起打网球。
这取决于各种各样的因素,比如你是否能按时下班,是否能提前下