E-Learning数据挖掘:模式与应用*


发布时间:2012-03-21 浏览量: 信息来源: 《中国高教研究》2012年3期 作者:葛道凯

 

葛道凯
    本文系教育部科学技术研究重点项目“E-Learning学习过程中的数据挖掘”(项目编号:108185)的研究成果的研究成果。
    摘要:随着教育信息化的快速发展特别是数字化校园和网络高等教育的日益普及,教育领域中部署了众多的软件系统,在这些软件系统中存储着海量的教育数据。如何利用这些教育数据,使这些数据转变为信息、知识,并为教育决策、教学优化服务,可从E-Learning数据挖掘中找到一些答案。文章系统梳理了国内外E -Learning数据挖掘的研究进展,并采用格语法分析方法对“E-Learning”的关键要素和过程进行分析,提出可以“谁在学、学什么、怎么学、学得如何”这一系列问题为主线,开展E-Learning数据挖掘工作,从而获得对E-Learning现状的更加完整的认识。在尝试回答“谁在学、学什么、怎么学、学得如何”的过程中,分解出三类挖掘任务情境即用于回答“谁在学”的学习者特征挖掘,用于回答“学什么、怎么学”的学习过程挖掘以及用于回答“学得如何”的学习结果挖掘,并对应地构建出三种数据挖掘模式。对模式的应用结果表明,这三种数据挖掘模式在E-Learning要素和过程分析中是有效的,较好地拓展了对E-Learning关键要素认识的完整性,包括对“谁在学”有了更全面的认识、对“学什么、怎么学”有了更准确的认识和对“学习的结果如何”有了更深入的认识。
    关键词:教育信息化;E-Learning;数据挖掘;模式;应用
    一、引言
    在过去的10余年,随着教育信息化的快速发展,特别是数字化校园和网络高等教育的大量实践,教育领域中部署了众多的软件系统.在这些软件系统中存储着海量的教育数据。如何利用这些教育数据,使这些数据转变为信息、知识,并为教育决策、教学优化服务,便是E-Learning数据挖掘的出发点和落脚点。E-Learning数据挖掘指的是一个将来自各种E-Learning软件系统(主要是网络教学平台)的原始数据转换为有用信息的过程,这些有用信息可为教师、学生、家长、教育研究人员、教育管理人员以及E-Learning软件系统开发人员所利用,以实现对学生及其所接受教育的更好理解,并可据此采取更有针对性的管理和教学优化措施。广义讲,E-Learning理解为通过因特网进行学习与教学的活动[1]。基于聚焦研究问题的考虑,在本文中,E-Learning的内涵则界定为“基于网络教学平台的学习”。这是由于开展数据挖掘需要系统的、结构化的数据.“基于网络教学平台的学习”可以产生系统性强、结构良好的学习记录数据,而“基于因特网的学习”则可能无法提供这些数据。
    开展E-Learning数据挖掘的一般过程包括“收集网络教学平台用户使用数据”,“数据预处理”,“应用数据挖掘算法”,“解释、评估、应用所获得的结果”等环节.这与一般意义上数据挖掘项目的实施流程是一致的。
    二、文献研究综述
    目前,国内外已不乏E-Learning数据挖掘或教育数据挖掘方面的研究。国外研究方面,Romero和Ventura (2007)[2]、Baker和Yacef (2009)[3]分别对1995年至2005年间的相关研究以及2008年至2009年间的相关研究进行过综述.虽然这两项综述研究的主题是“教育数据挖掘”.但从综述内容来看,大部分已有研究的挖掘对象是E -Learning系统产生的数据,对传统课堂数据的挖掘仅占少数。这两篇文献主要从数据挖掘方法的角度对已有研究进行分类阐述。综合Romero和Ventura (2007)、Baker和Yacef(2009)对教育数据挖掘方法的分类,这些方法包括:统计分析与可视化,聚类(聚类、离群点分析),预测(决策树、回归分析、时序分析),关系挖掘(关联规则挖掘、序列模式挖掘、相关分析)和文本挖掘等,其中预测挖掘方法、关系挖掘方法以及聚类挖掘方法在E-Learning数据挖掘领域的应用更为广泛。
    鉴于国外已有比较成熟的综述研究.笔者主要从挖掘任务的角度重点回顾国内E-Learning数据挖掘E-Learning的基本要素包括学习者、教师、学习资源、交互工具、评价工具等,主要行为则有浏览资源、师生交互、练习考试等,在完成这些行为的过程中将产生学生的学习记录和教师的教学记录。分析E-Learning的要素和行为,可以作为挖掘对象的数据有学习者、教师、学习者资源浏览行为记录、学习者练习考试行为记录以及师生交互记录,对应的挖掘任务则有学习者特征识别、学习者在线学习行为分析、师生交互分析等。关于这三种类型挖掘任务的国内研究情况简述如下。
    在学习者特征识别方面,目前基于网络教学平台数据开展学习者特征识别研究比较少,已有的研究中如张弛、王慧敏等人利用EM聚类算法、决策树算法对移动学习中的学习者进行聚类、分类分析,发现移动学习平台中学生群体的分布特点及在资源需求上的差异.从而为改进和推荐移动学习课程资源设计提供支持[4-6]。其他相关研究还有,为改进大学的本科招生工作.对潜在优质生源特征及选取规则的研究[7-9]。但这些研究的数据并非来自网络教学平台,而是来自教务管理系统。
  在学习者在线学习行为分析方面,不少研究者通过教学平台网络日志分析来描述在线学习行为[l0-12]。但从研究方法来看,这些研究者主要采用统计和可视化方法来描述学习者的在线学习行为,几乎没有涉及其他形式的数据挖掘方法。相比于国外的研究,国内在方法应用上显得还不够灵活、多样。另外,研究者将在线学习行为的影响因素归结为网络资源和学习支持服务两个方面[13-15],主要侧重外部因素。
    师生交互分析指的是对网络教学平台中交互论坛中的数据所做的分析,该分析结果可以帮助教师诊断学生对教学目标的掌握程度,以便给学生提供及时的反馈和指导。交互分析中常用的分析方法有社会网络分析法、内容分析法和系统建模法[16],对应的数据挖掘方法则有社会网络分析、文本挖掘和序列模式挖掘。其中,社会网络分析常用于虚拟学习社区或其他学习平台中“学习者或师生的交互网络”的研究[17-20]其次是“博客社区中的社会网络”的研究[21]。内容分析法则用于协作交互文本内容分析、协作特征标识,并且侧重计算机支持的内容分析法[22]23系统建模用于以形式化方法描述和预测协作交互过程,常见建模方法有有限状态机、隐马尔科夫(HMM)模型、Petri网等[16]。
    从上述文献分析来看,有关E-Learning数据挖掘的研究已有一些尝试.其中常用的数据挖掘方法有预测挖掘、关系挖掘和聚类挖掘,典型的挖掘任务则有学习者特征识别、在线学习行为分析、师生交互分析等,E -Learning数据挖掘所需的数据有时还要从E-Learning系统以外的软件系统中补充。本文的关注重点是,构建特定的E-Learning数据挖掘模式并检验数据挖掘模式的有效性:基于E-Learning实践,遴选出若干典型数据挖掘任务情境,根据任务选择挖掘方法和挖掘工具.并按照一定的流程对这些方法和工具进行重组,形成特定的E-Learning数据挖掘模式,从而使一些复杂的数据挖掘任务可以比较简便地得以完成。
    三、E-Learning数据挖掘模式构建
    E-Learning数据挖掘模式为完成特定挖掘任务而建。从前文对挖掘任务的分析来看,E-Learning的要素很多,我们可以对各个要素如学生、教师、学习内容、学习活动逐个进行挖掘,但是却缺乏一条逻辑主线将这些散落的挖掘选题组织起来。下面,笔者采用格语法中的格框架方法24,以“E -Learning”为中心谓词进行语义格标识。常见的语义格包括施事格、工具格、承受格、使成格、处所格、客体格等。所得结果如图l所示。
    如图1所示.笔者用数字编号标出需要重点关注的四个语义格.这四个语义格对应的内容在教学平台或教务管理系统中有数据记录,并且可形成一条清晰的逻辑主线,即以“谁在学、学什么、怎么学、学得如何”这一系列问题为主线,采用数据挖掘方法对这四个语义进行挖掘分析,将使格框架中的中心谓词“E -Learning”的细节更加清晰,从而形成对E-Learning现状的更加完整的认识。
    围绕这一逻辑主线.可以产生三个挖掘任务情境,即用于回答“谁在学”的学习者特征挖掘,用于回答“学什么、怎么学”的学习过程挖掘以及用于回答“学得如何”的学习结果挖掘,从而构建出三种数据挖掘模式.可为他人完成类似的挖掘任务提供参考。
    (一)E- Learning数据挖掘模式构成要素
    E -Learning数据挖掘模式由“数据挖掘工作”、“工具与算法”以及“数据”等三要素构成,“工具与算法”为“数据挖掘工作”提供支撑,并产生相应的“数据”,如图2所示。这三个要素在时间上的展开将分别形成数据挖掘工作流、工具与算法流以及数据流。
    数据挖掘工作符合数据挖掘的一般过程,包括数据收集、数据预处理、数据挖掘、模式解释评价与应用等环节,根据任务情境的不同,“数据挖掘工作”各环节各有特点。
    工具与算法是指数据挖掘工作流中用到的各种工具及若干算法。在本文中用到的数据挖掘工具有SQL SERVER 2005 Analysis Service (SSAS),SPSS13.0,Excel 2007,UCINET 6.0,Weka,它们各具特色。这些数据挖掘工具中有些是不可替代的,如UCINET6.0用于社会网络分析和社会网络图绘制:有些则有着相似的功能,如SQL SERVER 2005Analysis与Weka都是专门的数据挖掘工具,SPSS13.0和Excel 2007都是统计分析工具。在本文中用到的算法涵盖数据挖掘的经典算法,包括决策树算法、时序算法、聚类分析算法、顺序分析与聚类分析算法、关联规则算法、线性回归算法以及统计与可视化方法等。
    数据则是在应用工具和算法时产生的各类数据.包括挖掘得到的各类知识,如可视化图表、频繁项集、规则、序列模式、网络图等。
    (二)学习者特征数据挖掘模式
    学习者特征数据挖掘模式用于学习者特征分析的任务情境,如图3所示。
    1.数据挖掘工作流。数据挖掘工作流过程包括数据收集、数据预处理、数据挖掘、模式解释评价与应用等环节。在数据挖掘环节中,主要有两项任务,即“学生数量统计与趋势预测”、“学生特征分类与相关分析”。
    2.工具与算法流。工具与算法流中,在数据挖掘环节所用到的工具有SPSS、SQL SERVER、SSAS、Excel,用到的算法和功能则有时序分析、回归分析、聚类分析、相关分析、分类汇总和图表绘制,SPSS的时序分析和回归分析主要用于学生数量趋势预测.SSAS的聚类分析则主要用于学生特征发现。
    3.数据流。在应用工具和算法时则会产生各类数据,形成数据流。
    (三)学习过程数据挖掘模式
    学习过程数据挖掘模式用于学习过程分析的任务情境,如图4所示。
    在数据挖掘工作流的核心环节,主要的数据挖掘任务有学生登录行为分析、学生资源浏览模式分析、师生交互论坛分析和学生行为影响因素分析,所用到的工具和算法则有SSAS的聚类分析与顺序分析、聚类分析、关联规则等以及UCINET的网络图绘制等。
    (四)修业结果数据挖掘模式
    修业结果数据挖掘模式用于修业结果分析的任务情境,如图5所示。
    在数据挖掘工作流的核心环节中.主要的数据挖掘任务有毕业生(辍学学生)特征分析、毕业(辍学)结果影响因素和毕业(辍学)时间影响因素分析、毕业(辍学)结果预测规和毕业(辍学)时间预测等,所用到的工具和算法则有SPSS的生存分析功能和SSAS的决策树算法。
    四、E-Learning数据挖掘模式应用及其发现
    实施E-Learning数据挖掘,最终是要产生有利于教育教学决策和过程优化的有用知识.这就要求从实践中寻找应用需求,获取E-Learning过程中产生的各种数据,应用数据挖掘方法解决真问题。笔者选取了网络高等教育的在线学习为挖掘对象,挖掘网络高等教育学习者、在线学习过程和修业结果等内容,尝试应用上述三种数据挖掘模式,实现对E-Learning关键要素新的完整认识。
   (一)数据来源
    在我国.目前有69所高等院校作为现代远程教育试点院校共同开展网络高等教育.但是各自的办学规模差异很大.其中中央广播电视大学网络高等教育的办学规模要远大于其他68所试点院校。自1999年以来,中央广播电视大学所举办的网络高等教育(一般称作“中央电大开放教育”,下同)始终占有全国网络高等教育总规模的60%-70%,因此,中央电大开放教育在我国网络高等教育领域更具代表性。因此,笔者选取中央电大开放教育作为研究样本,数据主要源自两类平台,即电大在线网络教学平台( http://www.open.edu.cn)和中央电大开放教育教务管理系统,教务管理系统数据主要用于支持网络教学平台数据的分析。
    在网络教学平台数据的采集方面,笔者选取中央电大开放教育学生的入学课程《开放教育学习指南》作为研究个案.选取江苏电大2010年春季参加该课程学习的15017名学生为研究样本.通过获取这些学生的在线学习行为记录和基本信息记录(如性别、年龄、专业、职业),应用学习过程数据挖掘模式,开展在线学习行为描述与影响因素分析研究。
    在教务管理数据采集方面,笔者获取了中央电大自举办开放教育以来所招收的近700万名学生的专业层次、性别、年龄、婚姻状况、教育背景、籍贯等信息,应用学习者特征数据挖掘模式,调查学生构成特点及其变化:笔者还获取了9所省级电大2001年、2002年两个年级的近10万名开放教育学生的婚姻状况、性别、年龄、籍贯、教育背景、毕业时间、修业结果等信息,应用修业结果数据挖掘模式,开展学生修业时间特点与预测研究。
    (二)主要发现
    总体来说.本文构建的三种数据挖掘模式在E-Learning要素和过程分析中是有效的,较好地拓展了对E-Learning关键要素认识的完整性,具体表现为:对“谁在学”有了更全面的认识:对“学什么、怎么学”有了更准确的认识:对“学习的结果如何”有了更深入的认识。
    第一,对“谁在学”有了更全面的认识。笔者发现了网络高等教育学生构成特点及其变化趋势。①以中央电大开放教育学生数据为研究样本,学生以专科学生为主.专升本学生为辅.并且专科学生比重逐年增加;②男生、女生比例相当,女生略多于男生.且女生比重逐年增加;③以非高等教育适龄人口(>22岁)学生为主.但是高等教育适龄人口(18-22岁)学生在逐年增加,学生中位年龄逐年减小,12年(1999年至2010年)来中位年龄已由28岁降至24岁;④未婚学生为主,已婚学生为辅,但已婚学生的比重在逐年降低;⑤入学时中职(中专)教育背景学生最多,其次是大学教育背景学生.再次是普通高中教育背景学生.但普通高中教育背景学生在专科学生中的比重逐年增加。
    上述“专业层次”、“性别”、“婚姻状况”、“年龄”等构成的变化存在显著相关性.“专业层次”构成的变化对“性别”、“婚姻状况”构成有较大影响,对“年龄”也有一定的影响。具体表现为:随着“开放本科”学生比重的下降,“开放专科”学生比重的上升.男生比重随之下降,学生整体年龄也在下降:随着22岁以下年龄段学生比重的上升,已婚学生的比重随之下降。
    第二,对“学什么、怎么学”有了更准确的认识。
    (1)学生基本以评价为导向,只浏览评价所要求浏览的资源,而很少浏览其他资源,并且在1-2天时间内突击完成所有资源的浏览任务。以中央电大《开放教育学习指南》网络课程的学习为样本.83%的学生的资源浏览数刚刚达到形成性考核的要求.而在达到要求的学生当中.有超过3/4的学生是在1-2天的时间里完成的,反映出学生的在线学习有集中性和突击性的特点。学生一旦进入该网络课程“课程章节”或“体验区”模块,则主要是在本模块活动,期间几乎不去访问其他模块直至离开:在课程主体部分即“课程章节”的学习过程中,极少用到“问题库”、“资料库”、“常用工具库”等学习辅助模块。学生资源浏览过程如图6所示。
    (2)从群体角度看,学生的在线学习行为在时间的分布上相对均衡。以中央电大《开放教育学习指南》网络课程的学习为样本.学生的学习活动较为均匀地分散在一天中的3个时段(下午时段学生登录率最高)、一周中的7天(周日学生登录率最高)、一学期中的15周(第5周、第6周学生登录率最高).没有学生登录率特别集中的某一周或某一天(单周最高登录率为30.3%,单日最高登录率为10.4%)。
    (3)从个体角度看,学生的在线学习时间相对较少。以中央电大《开放教育学习指南》网络课程学习为样本,有78.6%的学生登录天数在4天及以下.50%的学生登录天数在2天及以下。造成学生在线学习时间少的外在因素之一可能是缺乏必要的教学干预。影响学生在线学习时间投入情况的内在因素有性别、年龄和专业层次等.其中女生比男生投入的学习时间多,年长学生比年轻学生投入的学习时间多.本科学生比专科学生、专科比课程开放学生投入的学习时间多。其中,倾向于“登录天数”“少于3天”的学生有“专业层次=专科,性别=男,年龄=小于25岁”或“专业层次=课程开放,年龄=不小于25岁”等两个群体。
    (4)师生交互程度低,交互论坛的主要功能仅是答疑:教师在交互中扮演着“领导者”和“中介者”的角色,学生的主体作用未能充分发挥。以中央广播电视大学在线培训课程“学生支持服务”为例.在师生交互网络方面,网络密度约为2.2.即意味着平均每位成员仅回复了其他两位成员.并得到其他两位成员的回复。但是对于84天的长周期学习来说,这种交互强度是比较弱的。另外,教师在师生交互网络中不仅扮演了“领导者”的角色,而且还积极协调社群内不同成员之间的沟通,担负了重要的“中介”角色。相比之下,学生的主体作用未能充分发挥出来。
    第三,对“学习的结果如何”有了更深入的认识。
    (1)网络高等教育学生总体毕业时间集中在第5、6、7、8等学期,毕业时间跨度平均为12.35学期。以中央电大开放教育专科学生为例.在8年学习有效期内,学生毕业时间集中在第5、6、7、8等学期,如图7所示。
    这4个学期的毕业比例累计为0.932.是学生毕业的主要学期。研究样本17个批次的学生中,有13个批次的毕业时间跨度(99%学生毕业所需的时间)在11学期至13学期之间,少数批次( 2/17)的毕业时间跨度在7年以上.毕业时间跨度均值为12.35学期。由此看来,8年的最长学习年限是过长了,可以考虑缩短为7年甚至6年。通过相关分析表明,“毕业时间跨度”和“辍学率”呈显著正相关,即毕业时间跨度越长,其辍学率越高。
    (2)在网络高等教育学生中,人文与社会科学类专业的学生毕业率略微高于非人文与社会科学类专业,20-29岁和30-39岁两个年龄段学生毕业率高于其他年龄段学生,女性学生毕业率高于男性学生。
    (3)不同特征网络高等教育学生的毕业时间存在明显差异,婚姻状况、籍贯、入学时教育背景、年龄等变量是毕业时间的主要影响因素。
    以中央电大开放教育专科学生为例.在毕业时间差异方面,女性学生毕业时间显著少于男性学生,已婚学生毕业时间要显著少于未婚学生,本地学生毕业时间要少于非本地学生,中职教育背景学生毕业时间要少于普通高中教育背景学生,普通高中教育背景学生毕业时间要少于专科教育背景学生(这类学生攻读下一个专科学历)。采用Cox回归分析方法,构建了应变量为学生的毕业时间(以“学期”为单位),协变量为婚姻状况(未婚=0,已婚=1)、籍贯(非本地学生=0.本地学生=1)、教育背景(中职=0;普通高中=1;专科及其他=2)、性别(女=0,男=1)和年龄,状态变量为修业结果(毕业=1;在学=0)的学生毕业Cox回归模型。模型中婚姻状况、籍贯这两个协变量是促进性因素(危险性因素),它们有提高学生毕业率、缩短学生毕业时间的作用。教育背景、性别这两个协变量是阻碍性因素(保护性因素),有降低学生毕业率、延长学生毕业时间的危险。协变量年龄是一种无关因素。无关因素并不表示没有影响,而是这种影响是非线性的。
    (4)发现了预测网络高等教育学生毕业时间的若干规则。以中央电大开放教育专科学生为例,采用Microsoft决策树算法构建了以5项个人特征(婚姻状况、年龄、籍贯、教育背景、性别)作为输入值,以毕业时间为预测值的毕业时间决策树模型,并获得了“毕业时间早于第6学期的学生预测规则”和“毕业时间不早于第8学期的学生预测规则”等两组规则,如“婚姻状况=已婚.籍贯=本地学生,教育背景=中职,年龄>=4l——>毕业时间<6个学期”、“婚姻状况=未婚,年龄<23.性别=男一一>毕业时间>=8个学期”。
 (5)发现了预测网络高等教育学生辍学的若干规则。以中央电大开放教育专科学生为例,采用Microsoft决策树算法,选取年龄、性别、婚姻状况、教育背景、籍贯等5个属性作为输入值,学籍状态(1=毕业,0=辍学)为预测值,来构造预测学生学籍状态的决策树,顺着根节点直到颜色较深叶子,形成了判定学生修业状态倾向于“辍学”的规则。
    五、结论与启示
    笔者系统梳理了国内外E-Learning数据挖掘的研究进展,并采用格语法分析方法对“E-Learning”的关键要素和过程进行分析,提出应以“谁在学、学什么、怎么学、学得如何”这一系列问题为主线开展E-Learning数据挖掘工作,从而获得对E-Learning现状的更加完整的认识。在尝试回答“谁在学、学什么、怎么学、学得如何”的过程中,笔者提出三个挖掘任务情境即用于回答“谁在学”的学习者特征挖掘.用于回答“学什么、怎么学”的学习过程挖掘以及用于回答“学得如何”的学习结果挖掘.并对应地构建出三种数据挖掘模式。对模式的应用结果表明,这三种数据挖掘模式在E-Learning要素和过程分析中是有效的,较好地拓展了对E --Learning关键要素认识的完整性,包括对“谁在学”有了更全面的认识、对“学什么、怎么学”有了更准确的认识和对“学习的结果如何”有了更深入的认识,可为教育决策者、教育管理者、教学服务人员、科研人员、技术开发人员等提供以下3点启示:①恰当运用数据挖掘技术能够为优化教育规划和管理、提高教育教学质量、改进教育软件设计与开发提供有益帮助。②对于多数教育机构来说,在教育教学过程中适时应用数据挖掘技术不仅是必要的,也是可能的。③注重教育教学过程中相关信息的采集和存储是一项有价值的活动。
    (葛道凯,中央广播电视大学教授,北京100031)
    参考文献
[l] 何 克 抗E-Learning的本质——信息技术与学科课程的整合[J].电化教育研究,2002(01):3-6.
[2]Romero & Ventura Educational Data Mining: A Survey from 1995 t0 2005[Jl. Expert Systems with Applications, 2007(33):125-146.
[3] Baker&Yacef. The State of Educational Data Mining in 2009:A Review and Future Visions[EB/OL]. http://www.educationaldatamining.org/JE DM/images/articles/vol1/issue1/JED MVolllssuel_BakerYacef.pdf.
[4]张驰,移动学习中使用EM算法的学生聚类分析[J].中国远程教育,2009(05).
[5]王慧敏,陈泽宇,王敏娟,张弛,决策树技术在移动学习性别差异研究中的应用[J],现代教育技术,2009(05).
[6]刘  钢,王敏娟,张驰,王慧敏,陈笑怡,移动学习中的数据挖掘研究[J].中国远程教育,2011(01).
[7]常 桐 善.数据挖掘技术在美国院校研究中的应用[Jl.复旦教育论坛,2009(02).
[8]成平广.ID3算法在高校招生决策中的应用研究[J].重庆教育学院学报,2008(05).
[9]邢  涛,廖冉,多分类支持向量方法的本科招生生源质量模型[J].哈尔滨工业大学学报,2010(11).
[10]谢维奇.基于“电大在线”远程教学平台的Web数据挖掘[J].教育信息化,2004(10).
[11]宋江春,陈文林.Web使用挖掘及其在远程教育教学支持服务中的应用研究[J].中国远程教育,2005(07).
[12]表明,陈伟杰,网络教育学习者在线学习行为分析研究[J].浙江现代教育技术,2006(04).
[13]赵丕元,影响学生远程学习行为因素的分析[J].中国远程教育,2002(08).
[14]龚志武.关于成人学生网上学习行为影响因素的实证研究[J].中国电化教育,2004(08).
[15]肖爱平,蒋成凤,网络学习者网上学习现状、影响因素及对策研究[J].开放教育研究,2009(01).
[]郑兰琴,协作学习交互分析方法研究综述[J].远程教育杂志,2010(06).
[17]胡  勇,王  陆.异步网络协作学习中知识建构的内容分析和社会网络分析[J].电化教育研究,2006(11).
[18]冯  锐,谢英香.当代大学生虚拟与现实社会人际关系的差异性分析[J].现代教育技术,2009(01).
[19]王  陆.虚拟学习社区的社会网络分析[J].中国电化教育,2009(02).
[20]Jianwei Zhang, Marlene Scardamalia, Richard Reeve, Richard Messina. Designs for Collective Cognitive Responsibility in Knowledge-Building Communities [J].Journal of the Learning Sciences, 2009(18).
[21]叶新东,邱  峰,沈敏勇.教育技术博客的社会网络分析[J].现代教育技术,2008(05).
[22]李艳燕,廖  剑,王  晶,黄荣怀.协作学习交互分析工具及其案例研究[Jl.开放教育研究,2007(04).
[23]王  晶,李艳燕,王迎,黄荣怀,赵东轮,基于交互分析的协作学习过程研究——以E-learning导论课程在线课程分析为例[J].中国电化教育.2007(06).
[24]百度百科.格语法[EB/OL].http://zhidao.baidu.com/question/209096022.html.
E-Learning Data Mining: Patterns and Applications
                           Ge Daokai
              (The Open University of China, Beijing 100031)
     Abstract: As educational informatization especially digital campus and online higher education develop rapidly, more and more software systems have been deployed and there stores massive educational data. How could we fully use the massive educational data and transfer the data into useful information and knowledge in order to make scientific educational decision and optimize instruction? Maybe we could find some inspirations from E-Learning data mining. In this paper, the author reviews domestic and overseas literatures about E-Learning data mining; and analyses the key elements and processes of E-Learning in the frame of case grammar. Then the author brings forward a new research route of E-Learning data mining which is constituted by a series of questions-Who to Learn, What to Learn, How to Learn, How about the Learning Result. In this way, a much more integrated understanding about E-Learning could be acquired. For answering the questions above, the author puts forward three data mining task situation including learner characteristics data mining for answering Who to Learn, learning process data mining for answering What to Learn and How to Learn, and learning result data mining for answering How about the Learning Result. Correspondingly, the author constructs three E-Learning data mining patterns. The application of these three patterns shows that the patterns are effective in analyzing E-Learning elements and processes. And the information and knowledge acquired in the E-Learning data mining process of this paper extends the integrity of understanding about E-Learning, which includes more overall understanding about Who to Learn, more precise understanding about What to Learn and How to Learn and deeper understanding about How about the Learning Result.
        Keywords: educational informatization; E-Learning; data mining; pattern; application