Add. Summarization

pull/2/head
benjas 4 years ago
parent 464f107928
commit 087c36b594

@ -234,3 +234,23 @@ ID3算法
5. 否则对Ag的每一个可能值ai依![1618750408613](assets/1618750408613.png)将D分割为若干非空子集Di将Di中实例最大的类作为标记构建子节点由节点及其子节点构成树T返回T
6. 对第i个子节点以Di为训练集以A - {Ag}为特征集递归地调用1~5步得到树Ti返回Ti。
C4.5算法大体相同只不过计算的是信息增益比而不是信息增益。我们通常也是用C4.5作为决策树的算法,其区别也就在于多了个分母。
### 总结
Summarization
1. 决策树的核心思想:以树结构为基础,每个节点对某特征进行判断,进入分支,直到到达叶节点。
2. 决策树构造的核心思想:让信息熵快速下降,从而达到最少的判断次数获得标签。
3. 判断信息熵下降速度的方法:信息增益。
4. 构建决策树算法ID3使用信息增益、C4.5(使用使用信息增益比)。
5. 信息增益会导致节点偏向选取取值角度的特征的问题。
> 关于第5点的补充统计学习和西瓜书都是给的这个解释但还有另一种解释就是信息增益导致大数问题——>概率是否准确的问题。

Loading…
Cancel
Save