热门关键字:  听力密码  听力密码  新概念美语  单词密码  巧用听写练听力
图书信息

试卷质量统计分析与数据挖掘原理、设计与实现

中国水利水电出版社
    【作 者】张春生 著 【I S B N 】978-7-5084-9338-1 【责任编辑】杨元泓 【适用读者群】 【出版时间】2012-02-27 【开 本】16开 【装帧信息】平装(光膜) 【版 次】第1版第1次印刷 【页 数】164 【千字数】160 【印 张】10.25 【定 价】32 【丛 书】 【备注信息】
图书详情

    试卷分析是了解学生对知识点掌握程度、教师出题情况的第一手材料,针对于试卷的数据挖掘可得出试卷的潜在信息规则,便于决策者调整教学计划、教学方法和手段,提高教学质量。基于以上原因,在大量研究和长时间应用的基础上编著了此书。

    本书共五章,包括两部分:第一部分包括三章,第1章论述试卷质量分析的意义及现状;第2章介绍基本统计学原理;第3章介绍试卷质量分析系统设计。第二部分包括两章,第4章介绍相关数据挖掘算法;第5章介绍数据挖掘的实现。

    本书可作为本科生学习教育统计学应用、数据库技术、数据挖掘理论及应用、程序设计等领域知识的参考书,也可为研究生和教育研究及决策者在进行试卷分析和数据挖掘理论研究、软件设计方面提供帮助。

    为迎接2006年的本科教育水平评估,内蒙古民族大学决定设计一套学生试卷分析软件供全校使用,同时进行了两次立项,首先是2003年的《学生试卷分析系统》,当时查询了很多资料,很多学校也编写了这样的系统,大部分是围绕着整个试卷的总分进行一般性的统计学分析,没有进行更深层次的研究。所以,本书从学生试卷的小分出发,把分析工作定位到每个小题,除进行一般性统计分析外,又在教师漏题方面进行了分析,在班级的纵向和横向方面做了一些比较工作,进而也在分析结果可视化方面做出贡献。

    2007年申请内蒙古自治区教育厅立项为《基于多策略的学生成绩数据挖掘及分类培养决策支持》,目的是想进一步在数据挖掘和决策支持方面进行研究。本书在此课题的基础上,从加快扫描速度、低频规则的发现方面对Apriori算法做了比较深入的研究,提出应用纵横距离法进行异常成绩检测和应用三次参数样条函数方法进行丢失数据的修补。在模糊聚类分析(FCM)方面、决策树方面也进行了比较深入的研究,同时取得了一些相应的研究成果。

    经过查阅很多资料,发现国内在学生成绩分析与数据挖掘方面的成果难登大雅之堂,使得这方面的有价值的资料很少,但个人认为自己的研究比较系统,在试卷质量分析和数据挖掘方面有独到的见解,并取得了一定的成果,所以产生了写一部专著的想法。

    1.试卷分析方面

    针对试卷质量分析和学生考试成绩分析的要求,首先进行了有关试卷分析的统计学指标介绍,包括最高分、最低分、平均分、分数段分布,同时也对难度、易度、区分度、方差、标准差等进行了介绍,着重介绍这些指标对试卷质量评价的影响。

    同时给出了正态分布和峰值的判断原理,并通过峰值等判断实现对试卷质量的自动评语。

    依据统计分析的基本理论以及学校的具体要求,进行了需求分析、数据库逻辑设计以及程序的总体设计,实现了各模块的基本功能,尤其是自动评语的产生。

    2.可视化方面

    本书进行了试卷质量分析报表设计,同时通过可视化的形式,显示统计结果。并且公布具体的算法和程序设计方法以及全部的源代码,对想在此方面进行研究的人员提供有价值的资料,同时也可以作为学生学习编程的案例教程。

    3.数据挖掘方面

    基于数据挖掘理论,提出应用三次参数样条函数法对部分缺失数据进行修补;提出应用纵横距离检测算法实现异常成绩挖掘;为加快挖掘速度,提出基于数据库一次扫描的Aprior算法;针对Aprior算法基于高频的缺点,提出基于群体局部特征分段支持度的Aprior算法,实现对经典Aprior算法的扩充,对低频规则进行挖掘;提出应用决策树算法实现对学生成绩的挖掘。

    本书给出全部的算法和部分源代码,方便读者将其应用到其他的知识领域。

    在完成基础研究和这部专著过程中,引用了别人的成果,将在本书的参考文献中列出,在此表示诚挚的感谢,同时感谢在此项工作中给予支持的所有同仁。书中所列的观点是一家之言,仅代表个人观点,由于个人的水平和所涉猎的知识有限,不足和错误之处在所难免,希望各位同仁批评指正。

    张春生

    2011年11月

    前言
    第1章 绪论 1
    1.1 试卷质量分析的意义及现状 1
    1.2 本书的主要工作 5
    第2章 基本统计学原理 6
    2.1 一般统计指标 6
    2.2 难度、易度 7
    2.3 区分度 8
    2.4 试卷信度 9
    2.5 试卷效度 10
    2.6 正态分布的判断 11
    2.7 自动评语的产生 12
    第3章 试卷质量分析系统设计 14
    3.1 数据库设计 14
    3.2 程序总体结构 19
    3.3 主要功能模块实现 21
    3.3.1 主程序设计 21
    3.3.2 基本数据输入程序设计 28
    3.3.3 试卷分析 32
    3.3.4 信息维护 38
    3.3.5 系统维护 39
    3.4 报表设计 42
    3.5 教师分析 47
    3.6 多维数据显示 59
    第4章 相关数据挖掘算法 68
    4.1 异常成绩发现 72
    4.2 缺失成绩的修补 76
    4.3 关联规则 80
    4.4 关联规则算法的优化 84
    4.4.1 改进Apriori算法描述 85
    4.4.2 算法描述 86
    4.5 局部特征的知识发现 88
    4.5.1 基于分段支持度的Apriori算法基本原理 89
    4.5.2 基于分段支持度的Apriori算法描述 91
    4.6 决策树算法 91
    4.6.1 决策树方法概述 92
    4.6.2 数据挖掘中决策树算法的主要进展 93
    4.6.3 面临的挑战与发展趋势 99
    4.7 模糊聚类算法(FCM) 100
    4.7.1 模糊集基本知识 100
    4.7.2 K均值聚类算法(HCM)介绍 100
    4.7.3 模糊C均值聚类 102
    4.7.4 FCM算法的应用 104
    第5章 数据挖掘的实现 105
    5.1 数据库一次扫描Apriori算法 105
    5.2 部分缺失数据的三次参数样条函数修补方法 115
    5.3 基于纵横距离的异常点检测算法及应用 116
    5.4 基于分段支持度Apriori算法 123
    5.5 决策树分析方法 133
    5.6 模糊聚类算法实现 140
    参考文献 153
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册