« 首页 - 西安必信达软件技术有限公司 - BXDSOFT.COM
大数据平台在智慧教育中的应用思考
「在大数据环境下,如何高效地存储和检索教育资源成为教育大数据亟待解决的问题。智慧教育涉及教学、管理和资源等全流程,而教育大数据在时间空间上分散孤立,数据内涵差异巨大,大量结构化与非结构化数据共存。从学生和教师的用户角度来看,高校缺乏提供个性化服务的能力,在教学和生活方面都还存在很大的提升空间。本文就大数据平台在智慧教育中的应用提出一些思考,重点研究教育大数据之间的动态关联,教育大数据语义推荐,教育大数据搜索和可视化等多方面技术。(2021-1-24)」
关键词: 教育大数据;教育技术;知识图谱;动态关联;数据检索和可视化
  中图分类号: :TP399    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.10.069
  本文著录格式:杨晓贤,翁雯,吴嘉琪. 大数据平台在智慧教育中的应用思考[J]. 软件,2020,41(10):270272
  【Abstract】: In the context of big data, how to store and retrieve educational resources efficiently has become an urgent problem to be solved. Intelligent education involves the whole process of teaching, management and resources, while the big data of education are scattered and isolated in time and space, with huge differences in data content, and a large amount of structured and unstructured data. From the perspective of students and teachers, universities lack the ability to provide personalized services, and there is still much room for improvement. This paper shows our thoughts on the application of big data platform in intelligent education, focusing on the dynamic correlation, semantic recommendation, searching and visualization for education big data.
  【Key words】: Big data on education; Educational technology; Knowledge graph; Dynamic correlation; Data retrieval and visua lization
  0  引言
  當前我国教育现代化不断发展,数字教育资源不断丰富,信息化教学的应用不断拓展和深入,教育管理信息化初见成效。爆炸式增长的教育资源已经呈现出海量大数据特征,尤其是视频、文本、音频等非结构化教育资源的形式相对不固定[1]。教育领域的大数据管理已面临巨大挑战,而传统的关系型数据库管理系统无法满足以数据为中心的大数据管理的需求[2-3],如何高效地存储和检索教育数据成为教育行业亟待解决的问题[4-5]。近年来,智慧教学成为高校教学改革的新需求,其中整合教育教学资源并能提供方便、有效的检索方法将是未来高等学校教学改革的重要基础[6],例如数据挖掘和内容、智能数据分析、教育数据检索、教育教学预警等,将是高校全周期育人的重要基础保障。
  针对智慧教育的大数据平台建设,在调研大量实际需求和建设方案之后,我们认为教育大数据具备在时间空间上分散孤立、数据内涵差异巨大、大量结构化与非结构化数据共存等特征。需要动态关联[7]、语义推荐和可视化等相关技术和方法来支持大数据:(1)动态关联:教育数据关联大多必须手动完成,并且数据量增长速度呈几何级数,而新数据往往需要重新更新,动态关联不仅需要展现领域层面上的从属关系,而且还需要体现实体多属性关系。(2)语义推荐:查询教育大数据不仅需要先理解用户的真正查询意图,而且还要根据用户关键字推理知识图谱推荐相似内容,最后对查询结果进行相似度排序并返回给用户。(3)可视化:展示隐藏在教育大数据内部之间的关系,让用户能够从多维角度对数据展开分析和理解,从而获得有价值的信息,减少重复的信息检索工作。
  因此,在大数据环境下,研究适合于教育大数据管理和维护平台[8-9],同时考虑智慧教育新特征,如何更好地支持数据关联关系的“活性”和“自动更新”,其中“活性”表现在关联关系是动态的、分内容的、允许动态配置的,“自动更新”则表现在关联关系是具有自我认知的,能实时更新关联的知识库。针对这些问题,从智慧教育的角度重新审视教育资源建设的目标“解决教学到知识获取技术的鸿沟”,本文将探讨面向智慧教育的大数据平台建设的相关问题,包括问题分析,应用场景研讨,关键技术等,支持教学教育改革,支持高水平大学建设。
  1  教育大数据管理的技术问题分析
  传统的数据库是固定数据的实体,数据与数据之间的关联性通常依赖数据库表的主键/外键设置,数据库中的表与表之间的联系设置好后就固定了,一般不允许改变。这种设计模式下的数据库对于多维空间、超层次关系的关联关系处理能力就变得非常薄弱。因此,我们认为可以在关系型数据库作为结构化数据存在的基础上,引入非关系型数据库对非结构化教育资源进行灵活存储。其中基础教育数据包括结构化数据,诸如来自教务处的学生选课信息和成绩数据,以及信息化办公室的教职工和学生的基本数据;而非结构化教育资源则可以用来存储一些辅助的非固定格式的数据、图形、图像以及声音等。两者的结合与互补能有效地支持大数据存储和管理。   教育大数据的更新涉及大量数据更新以及数据之间的关联关系更新。一方面,当前大多数高校的课程资源网站功能单一,形成数据孤岛,需要对这些教育数据的关联关系进行更新和维护。另一方面,数据本身存在内容语义,需要通过特征抽取算法,或自动或半自动地标识教育大数据的特征,对这些数据进行管理。因此,我们认为,引入知识图谱概念,采用特征提取技术,基于本体描述方法对大数据之间关联关系进行存储会是一种高效的解决方法。借助于知识图谱所描述的教育领域本体,一方面做到教育信息之间的关联,一方面有助于动态更新。
  用户在使用大数据平台时,核心的问题是能快速、准确地检索到所需要的数据。“快速”表明用户的等待时间不会过长,系统能在有限的时间内返回结果;“准确”表明平台能正确识别用户检索需求,从某种意义上来说,不仅实现传统的关键字检索,而且还实现基于知识图谱所描述的关联关系进行必要的推理,最终返回的检索结果是符合用户意图的有有价值的信息。因此,我们认为,引入搜索引擎和智能推理技术,用人工智能实现数据推荐将会是平台运行的重要保证。
  数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。在面对智慧教育大数据时需要思考:一方面如何将其科学地统计归类,另一方面如何将其准确地展示出来。因此,我们认为,可以引入数据可视化观念,在大数据平台构建相关模块,包括文本可视化,时空数据可视化,多维数据可视化等,将有助于用户直观了解分布规律和内在特征,从而获得有价值的信息,减少重复的信息检索工作,提高搜索效率。
  2  教育大数据的应用场景研讨
  2.1  学生需求
  在智慧教育环境下,学生可以获取包括电子讲义、课程录像等各类课程资料或者图书馆馆藏学习资料等,这些都是新智慧校园带来的便利[10-11]。在教育监督方面,学生可以通过刷校园卡、人脸识别、app以及小程序等多种形式完成上课签到,在课堂上使用手机扫描二维码进行抢答或讨论,与教师进行更多的沟通和交流。在校园生活方面,学生可以通过校园卡绑定的各项功能进行校园内消费,还可以通过学校提供的各种自助平台使自己的校园生活更加的丰富和方便。然而,如何对这些数据进行存储?抽取哪些特征数据描述学生肖像?如何主动发现存在异常的学生以及预警可能出现异常的学生?
  2.2  教师需求
  在智慧教育环境下,实现场景化、沉浸式、游戏型、互动式的创新教学方式,为教师减轻了教学任务上的重负[12]。如何存储管理教学过程中产生的大量教育数据值得深思。在课程管理方面,教师可以利用提供的大数据技术实现智能备课和辅助授课,包括个性化资源推荐、教学资源管理等。在成绩管理方面,大数据技术也可以帮助教师开展电子阅卷和成绩评估工作,例如客观题自动评分、作业/实验/报告的抄袭检测等。在教学辅助方面,一方面可以帮助教师随时掌握学生的学習状态,例如通过自动统计功能生成每位学生的实时学习报告,包括上课活动量情况、课程完成情况和章节学习次数趋势等,另一方面通过数据分析功能得到课程目标达成度结果帮助教师有针对性地调整教学内容和方法。
  2.3  学校管理需求
  随着高校智慧校园网软硬件设施逐步完善,学校及各处室、各专业部门都能通过学校或部门网站开展工作,拓宽了信息交流的渠道。但网站结构功能单一、数据孤岛依然存在,各部门各自为政,无法实现对学生学习情况的统一管理和数据分析等。因此,从教育教学质量保证需求来看,不仅需要统一数据格式以方便管理,使得数据能在不同的管理信息系统之间流动起来,实现一站式数据管理,而且还需要对这些数据进行关联分析和动态更新,例如教育教学的课程预警、考试成绩的质量分析、学生个人成长分析等。
  从学校人才培养需求来看,大数据平台能更有效地支持做好全周期育人,尤其是教育教学资源收集、整理、挖掘、推荐,更好地支持智慧教育这一新要求,将原先分散的、零碎的课程资源等进行合理存储管理后,采用智能算法支持相关课程学习资料推荐。此外,各类教学数据分类呈现能更加直观地让管理人员掌握当前教育教学情况,把控教学质量,科学合理修订学校的人才培养方案。
  3  如何建设教育大数据的应对方法
  3.1  教育大数据动态关联
  目前教育大数据的关联大多依靠人工实现,需要非常大的人力成本,并且随着教育大数据不断增多必须重复更新关联。基于此,可以将知识图谱概念引入到大数据平台,并作为其支持工具能很好地实现动态关联。采用本体的设计理念对教育数据进行表达能够更好地利用教育数据所蕴含的语义信息,从而提高检索的效率。在教育数据领域本体的构建上,考虑到本体建模的方便性和语义网知识表达的通用性,描述教育资源的关联关系。
  (1)教育大数据收集与资源融合。在教育数据方面,大数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息等棘手问题,因此,应对方法是突破多源异构大数据的数据形态,能做到数据融合融通。
  (2)建立面向教育资源的领域本体,支持构建知识图谱。尤其是非结构化数据的描述,由于数据属性多样性和不确定性,采用本体描述教育资源的知识图谱是非常合适。由于教育资源数据在各个领域存在多种从属关系,应对方法是采用本体描述教育资源的多关联机制。
  (3)动态关联使数据具备活性。教育数据的关联性实现更准确和专业的抓取和整理技术、进而提供尽可能全面准确的教育领域相关信息。应对方法是采用教育知识图谱,结合人工智能的特征提取技术,实现更新数据,支持更新关联知识。
  3.2   教育大数据语义推荐
  查询教育大数据首先需要准确理解用户的查询意图,然后根据用户关键字推理领域本体的从属关键字,最后基于相似度对查询结果进行排序并返回给用户。应对方法是采用分布式倒排索引的搜索引擎技术,实现教育大数据的高效检索,更好地支持本科教学和人才培养应用。   (1)通过分布式云存储体系实现海量数据存储应用。分布式云存储体系实现海量数据存储技术、负载均衡方法及分级存储等方面,有利于不断发展云存储系统体系结构,最大限度地满足教育大数据的需求,是对多源数据融合的高效数据存储方法。
  (2)基于倒排索引的搜索引擎技术应用。利用深度学习技术,数据挖掘技术以及特征描述技术,抽取数据特征后建立倒排索引文件,支持快速检索,此外,通过对教育领域知识图谱的知识推理,实现相关数据的检索。
  (3)个性化推荐技术应用。根据用户行为的偏好模型,采用相似度算法對返回查询结果进行排序。针对大数据推荐存在的问题,结合协同过滤算法、基于内容推荐算法、基于文本相似度推荐算法,提升大数据平台的用户体验度。
  3.3  教育大数据可视化
  展示隐藏在教育大数据内部之间关系,让用户能够从多维角度对数据展开分析和理解,从而获得有价值的信息,减少重复的信息检索工作。应对方法是采用搜索引擎支持用户检索相关数据,同时通过可视化分析技术展示检索结果。
  (1)搜索引擎技术应用。当用户检索教育素材大数据时,在知识图谱基础上结合本体推理机制,推理查询关键字在知识本体库中的父子关系,兄弟关系,以及复杂的约束关系,理解教育素材大数据在横向和纵向的语义关系,提高检索工作的效率和质量。
  (2)数据关联分析和可视化技术应用。采用人工智能算法对各种教育数据进行关联分析,对检索数据以视觉表现形式进行可视化展现。这涉及教育数据的数据整理和分析,以及可视化展示数据多维度之间的关系,将不同教育数据关联起来呈现。
  4  结论
  近年来,随着各高校在线课程资源的建设和发展,教育教学数据呈海量式增长,亟需进行资源整合并提供便利的检索平台。然而,当前大多数高校的课程资源网站功能单一、存在数据孤岛、无法融合并提供知识检索,需要“解决教学到知识获取技术的鸿沟”[10,13-14]。本文针对智慧教育问题,探讨了大数据平台建设的问题和应对方法。下一步的工作重点将对大数据平台设计的关键技术进行实践,努力搭建实用可行的基础支撑平台。
  参考文献
  [1]马文龙, 朱妤晴, 蒋德钧, 熊劲, 张立新, 孟潇, 包云岗. Key-Value型NoSQL本地存储系统研究[J]. 计算机学报, 2018, 41(8): 1721-1751.
  [2]杜小勇, 卢卫, 张峰. 大数据管理系统的历史、现状与未来[J]. 软件学报, 2019, 30(1): 1-15.
  [3]刘永楠, 李建中, 高宏. 海量不完整数据的核心数据选择问题的研究[J]. 计算机学报, 2018, 41(4): 915-930.
  [4]许正兴, 高海燕, 王慧. 创新教育导向下的智慧学习模式建构与实践路径[J]. 教师教育学报, 2020, 7(3): 23-28.
  [5]孙达明, 张雨新, 王震生, 曾艳. 基于专业教学资源库的混合式学习模式实践研究[J]. 当代教育实践与教学研究,  2020, 9: 13-14+74.
  [6]王建民. 领域大数据应用开发与运行平台技术研究[J]. 软件学报, 2017, 28(6): 1516-1528
  [7]王玢, 吴雅婧, 阳小龙, 孙奇福. 关联性驱动的大数据处理任务调度方案[J], 软件学报 2017, 28(12): 3385-3398
  [8]吴信东, 嵇圣硙. MapReduce与Spark用于大数据分析之比较[J]. 软件学报, 2018, 29(6): 1770-1791.
  [9]齐金山, 梁循, 李志宇, 等. 大规模复杂信息网络表示学习: 概念、方法与挑战[J]. 计算机学报 2018, 40(10): 2394- 2420.
  [10]高洪皓, 卞敏捷, 高珏, 陈章进. 基于分类分层和项目制结合的大学计算机基础教学模式探索[J]. 当代教育理论与实践, 2018, 10(6): 29-33.
  [11]杨丽君. 基于大数据技术的高校教育改革质量评价[J]. 计算机产品与流通, 2020, 5: 198.
  [12]李明瑶. 大数据时代在线教育的个性诉求与资源优化[J]. 教育理论与实践, 2020, 40(4): 23-28.
  [13]朱斐. 面向工程教育专业认证的《软件项目管理》实验教学探索[J]. 软件, 2018, 39(12): 187-190.
  [14]刘强. 人工智能在计算机网络技术中的实践与探索[J]. 软件, 2018, 39(11): 242-245.
(搭W9)
点击进入「必信达创业合作论坛」下一篇:试分析SCADA系统和Aprol上位监控组态软件在净水厂中的应用 »
Copyright © 1999-2021 西安必信达软件技术有限公司