决策树是听上去比较厉害且又相对简单的算法,但在实现它的过程中可能会对编程本身有更深的理解、尤其是对递归的利用
我个人的习惯是先说明最终能干什么、然后再来说怎么实现,这样也能避免一些不必要的信息筛选。所以,这一部分主要用于让已经知道一定的基础知识的童鞋知道最后能走多远,如果是想从头开始学的话可以无视这一章直接看第一章
id3 和 c4.5(可以控制最大深度),cart 可能会在假期实现
可视化;比如在比较著名的蘑菇数据集上的最终结果为(随机 5000 个训练):正确率 100%(大概挺正常的……)。其中,每个 node 最后那个括号里面,箭头前面是特征取值,箭头后面或者是类别、或者是下一个选取的特征的维度
运用 cv2 的话可以画出比较传统的决策树的可视化图,效果大致如下:
其中红色数字标注了该 node 选择了数据的哪个维度,绿色字母表示该 node 所属的类别,白色字母代表着对应数据维度特征的取值
比如说如果样本的第 4 维(从 0 开始计数)是 a、l 的话就判为类别 e,是 c、f、m、p、s、y 的话就判为类别 p,是 n 的话就再看样本的第 7 维、以此类推
虽说我这个决策树暂时不支持连续型特征,但相对应的它有一个好处:你不用把离散型数据处理成数值形式、而可以直接把它输入模型来训练。据我所知,scikit-learn 的 decisiontreeclassifier 还不支持这一点(自豪脸)(然而人家比你快 1~2 倍)。
华为p9 iPhonese 一加3 三选一,次旗舰选择你选哪个?
英飞凌推出PQFN封装、双面散热、25-150V OptiMOS™源极底置功率MOSFET
传感器检测中的抗干扰技术详解
贸泽电子开售STMicroelectronics配备FPU的 STM32H5 Arm Cortex-M33 32位MCU
江苏多维科技研发的TMR磁传感器芯片打破国外的技术垄断
用Python编写人工智能
时序逻辑:FPGA/ASIC电路结构
太狠了,某运营商关于在业务发展繁忙期取消休假的通知
我国金属再生产业机遇和挑战并存,金属再生产业仍拥有较大发展机遇
CPLD和FPGA的区别
液晶显示器的分类
中航光电参与韩国三大运营商的5G商用计划并设立研发中心
我国将于2017年建成时速400公里真空管道轨道试验线
使用电磁流量计被测定媒介中有气泡怎么办
未来智慧医院的建设方向
如何给排针排母电镀?
科创板睿创微纳独立董事孙志梅介绍、履历信息
高并发场景下请求合并
什么是TLBs/VALU/VLIW?
如何使用Arduino和非晶体管控制小型直流电动机