一个单身狗写下这个标题我是心虚!!!
很早就听说过决策树算法的威力, 很早之前就做过决策树模型的分析和应用, 这次就来看看决策树算法的操作和实际运用
首先, 要先理解什么是决策树呢?
根据我的理解, 再加上百度百科的解释, 决策树其实是一个预测模型, 现代管理决策者常用的有效工具, 他代表的是对象属性与对象值之间的一种映射关系, 复杂来说, 是指将构成决策方案的有关因素, 以树状图形的方式表现出来, 并据以分析和选择决策方案的一种系统分析法, 例如下图:
决策树解析
简单来说, 做决策的时候, 你需要从最上面的节点出发在每一个分支上, 都有一个判断条件满足条件, 往左走; 不满足, 向右走一旦走到了树的边缘, 一项决策就完成了
那么有哪些实际应用案例呢? 我就举个例子吧: 以某饭店多级决策树作为分析例子:
某饭店决定投资建饭店消耗品生产厂, 提出三个方案:
一是建大厂, 投资 350 万元; 二是建小厂, 投资 170 万元; 三是建小厂, 如果经营得好再扩建, 扩建再投资 150 万元;
咋一看, 第三种方案是符合现在大家经常说的精益创业的理念的: 先实验, 再修改, 最后放大操作那么这三种方案, 到底哪种是可行的呢? 这里的可行指的是能够在一定时间收回成本, 并且盈利, 因此需要管理人员对未来 10 年中前 4 年后 6 年的损益值和概率进行预测
这个案例天然适合决策树来分析, 经过分析, 很容易得到下面的决策树图:
接下来我们可以对结果做求解运算, 计算各点的收益期望值:
点:(80×0.8+10×0.2)×6=396
点:(40×0.8+5×0.2)×6=198
点和点期望值相比, 前者较大, 所以应选择扩建, 对不扩建进行删枝把点期望值减投资后所 246 万元移到点上来, 这是第一次决策
点:(80×0.8+10×0.2)×6=396
点:(80×0.2+10×0.2)×6=144
点: 396-150=246
点:(40×0.2+5×0.8)×6=72
点:(80×0.6+10×0.4)×4+396×0.6+144×0.4=503.2
点:(40×0.6+5×0.4)×4+246×0.6+72×0.4=280.4
各方案实际收益期望值:
建大厂: 503.2-350=153.2(万元)
建小厂: 280.4-170=110.4(万元)
因此我们可以得到结论: 应采用直接建大厂的方案, 净收益期望值为 153.2 万元
以上只是决策树模型的运用, 是针对特定的案例和有限的素材做分析, 这样是方便的但是如果是对大数据呢? 昨天偶然看到南开大学王树义教授关于大规模数据的决策数文章, 嗯, 很感兴趣, 就试着操作了一下, 就觉得很受启发下面就直接用王教授的案例再加上我的理解来做说明吧:
接下来需要解决的是: 这里有一份贷款资料, 总共将近 5 万条数据, 包括: 贷款级别贷款细分级一年内短期雇佣受雇年限居住状态 (自有按揭租住) 贷款占收入比例贷款用途贷款周期贷款申请人是否有不良记录贷款申请人是否有逾期 90 天以上记录透支额度占信用比例逾期罚款总额贷款是否安全等维度, 需要快速分析某个客户贷款是否安全
从这点来看, 决策树是非常适用的, 因为有不同条件, 就只要看是否满足相应条件即可, 那么决策树模型就不是非常适用了, 这里就引入了机器学习的决策树算法
这次就使用 python 语言作为数据处理和做决策的语言使用 Jupyter 作为本次运行决策树算法的环境, 需要使用到的是 python 中的 pandassklearn 库 Ok 就正式开始吧下图是实际操作的代码部分:
决策树算法代码
下图是通过上面算法得到的最终决策树算法模型:
决策树算法模型
我们可行非常方便的通过计算机做运算, 例如, 随便从原来的数据中找出一条来测试, 只需要执行:
决策树算法验证
我们可以看到得到的结果是 1, 而在之前那份数据中, 测试数据对应的结果也是 1, 因此这个模型是成立的
至此我们的决策数算法模型就完成
决策树还应用在哪里呢? 例如下图是根据网上相亲数据得到的关于女性在择偶决策方面的决策树, 可以发现女性在择偶的时候看的是吸引力哈和共同爱好, 嗯, 好吧, 其实都是看脸的时代
女性择偶决策树模型
其实, 决策树应用的案例还是非常多的, 无论是算法还是模型, 在实际运用中起的作用也是十分巨大的这是模型和算法的魅力, 有兴趣的朋友可以和我多多交流
我运营了一个叫做营销生财的小密圈社群, 专注数据化营销, 通过数据和营销创造财富我会经常在社群里分享关于营销推广的经典案例和教程, 以及数据采集和分析的教程和案例, 还有各种好玩实用的营销和分析工具现在已经有 150 位来自各行各业的朋友加入其中, 有来自华为腾讯淘宝等公司从事运营和数据的朋友, 期待你的加入(微信号: zds369466004)
来源: http://www.jianshu.com/p/698bf8ad77fc