一, 基本信息
标题: 决策树算法在学生课程成绩分析中的应用研究
时间: 2019
关键词: 决策树; 信息熵; 信息增益; 信息增益率
二, 研究内容
1. 信息熵和信息增益: ID3 算法 信息熵 E(S)=-P/(P+N)*log2[P/(P+N)]-P/(P+N)*log2[P/(P+N)]
E(Si)=-Pi/(Pi+Ni)*log2[Pi/(Pi+Ni)]-Pi/(Pi+Ni)*log2[Pi/(Pi+Ni)]
条件熵
信息增益 Gain( A ) =E( S ) -E ( A )
C4.5 算法 GainR ( A ) =Gain ( A ) /E ( A )
2. 决策树技术应用
分析得到的决策树
三, 结论
前面聚类分析是从学生成绩对文章进行分析, 而这篇文章主要是用决策树算法对学生平时成绩 (考勤, 回答问题, 作业完成) 和学生的调查数据信息来进行分析. 总结出整个的流程是: 数据 -- 构造决策树(使用 ID3 算法或者 C4.5 算法计算信息熵, 条件熵, 信息增益和信息增益率)-- 建立决策树 -- 修剪决策树. 通过前面的文献, 学生成绩分析系统现在暂时可以分两模块: 1. 分析成绩等级(聚类分析) 2. 分析影响学生成绩的主要因素(决策树)
四, 参考文献
[6]胡明明. 决策树算法在学生课程成绩分析中的应用研究[D]. 哈尔滨师范大学, 2019.
《决策树算法在学生课程成绩分析中的应用研究》 文献笔记(四)
来源: http://www.bubuko.com/infodetail-3281489.html