人工智能丨产业分析 “人工智能+教育”的发展历史 与研究进展 口文/张立山 张立山 华中师范大学国家数字化学习工程技术研究中心副研究员 毕业于美国亚利桑那州立大学,计算机科学专业博士,研究 方向为智能导学系统,学习分析技术。专注计算机与教育的 交叉学科研究,在相关国际期刊和国际会议发表论文20余 篇,并担任审稿工作 如何利用人工智能技术促进提升教学效果,甚至教育改革,逐渐成为了近年来人们 所关注的热点。本文通过对于智能导学系统、学习分析和文本答案自动评价这三个 典型领域的回顾,简述了人工智能技术与教育融合发展的历史以及研究重点的变迁 最后,展望了未来的发展方向 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
“人工智能 + 教育”的发展历史 与研究进展 □文 / 张立山 如何利用人工智能技术促进提升教学效果,甚至教育改革,逐渐成为了近年来人们 所关注的热点。本文通过对于智能导学系统、学习分析和文本答案自动评价这三个 典型领域的回顾,简述了人工智能技术与教育融合发展的历史以及研究重点的变迁, 最后,展望了未来的发展方向。 产业分析 华中师范大学国家数字化学习工程技术研究中心副研究员。 毕业于美国亚利桑那州立大学,计算机科学专业博士,研究 方向为智能导学系统,学习分析技术。专注计算机与教育的 交叉学科研究,在相关国际期刊和国际会议发表论文 20 余 篇,并担任审稿工作。 张立山 8
“人工智能+教育”的发展历史与研究进展 、人工智能+教育 近年来,随着人工智能的火热发展,各种类型的“人工智能+”不断涌现,其中“人 工智能+教育”在不同场合亦被不断提及,其所述內涵也不尽相同。为避免概念混淆 在本篇文章中,“人工智能+教育”单指以人工智能技术促进教育。 其实,“人工智能+教育”并非是最近几年才提出的概念,这个概念在国际 研究界已经有了相当长的历史。以该领域的著名期刊 International Journal of Artificial ntelligence in Education为例,该刊于1989年发行了第一期,距今已有30年的历史。 该期刊主要专注人工智能技术在教育中的应用以及学习辅助系统的设计。其中,以智能 导学系统( Intelligent Tutoring System,ITS)的演变为代表,深刻反映了人工智能与教育 融合的发展。随着大数据技术的广泛应用,学习分析技术( Learning analytics)和教育 数据挖掘技术( Educational Data Mining)作为“人工智能+教育”以及智能导学系统 中的一个分支,也越来越受到特别的关注。这些所提及的研究领域,着重关注人工智能 相关技术对教学模式变革以及教学效率提升的推动作用。另一方面,学习科学研究社 区( The International Society of the Learning Science)则着重关注如何使用技术抑或非技 术手段,提升实际教学效果。由于有着相似的研究目标,这两类领域的研究人员存在 着大量的重叠,共同致力于更好地理解学习者的认知过程,并利用各种手段提高学习 者的认知效率以及认知深度。匹兹堡大学和卡内基梅隆大学成立的 Learning research& Development Center和 Pittsburgh Science of Learning Center成为了众多“人工智能+教育 研究者成长的摇篮 与国际上“人工智能+教育”研究的发展不尽相同,国内“人工智能+教育”的 发展,更多得益于近几年工业界在人工智能和互联网应用的跳跃式发展,以及市场上对 教育类应用的巨大需求。因此,国内的“人工智能+教育”的发展更多地体现在工业界 进入大众和研究者视野的应用,更多的是迎合应试类和校园服务类需求,比如自动判分 自动搜题、练习智能推送、刷脸校园签到等,产生了一些优秀的工程类研究成果,但相 对于学习者认知过程的科学研究较少。国家自然科学基金委于2018年设立了F070的 新代码,旨在加强教育与信息技术深度融合跨学科的科学研究,相信未来国内在技术场 景下学习认知过程的研究会越来越丰富 如上所述,智能导学系统的演化,以及近年学习分析和教育数据挖掘的兴起,比 较好地反映了人工智能与教育融合的发展历程。另外,本文还以文本答案自动评价这个 具体应用领域为例,简述了人工智能相关技术的应用发展 (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
一、人工智能 + 教育 近年来,随着人工智能的火热发展,各种类型的“人工智能 +”不断涌现,其中“人 工智能 + 教育”在不同场合亦被不断提及,其所述内涵也不尽相同。为避免概念混淆, 在本篇文章中,“人工智能 + 教育”单指以人工智能技术促进教育。 其实,“人工智能 + 教育”并非是最近几年才提出的概念,这个概念在国际 研究界已经有了相当长的历史。以该领域的著名期刊 International Journal of Artificial Intelligence in Education 为例,该刊于 1989 年发行了第一期,距今已有 30 年的历史。 该期刊主要专注人工智能技术在教育中的应用以及学习辅助系统的设计。其中,以智能 导学系统(Intelligent Tutoring System, ITS)的演变为代表,深刻反映了人工智能与教育 融合的发展。随着大数据技术的广泛应用,学习分析技术(Learning Analytics)和教育 数据挖掘技术(Educational Data Mining)作为“人工智能 + 教育”以及智能导学系统 中的一个分支,也越来越受到特别的关注。这些所提及的研究领域,着重关注人工智能 相关技术对教学模式变革以及教学效率提升的推动作用。另一方面,学习科学研究社 区(The International Society of the Learning Science)则着重关注如何使用技术抑或非技 术手段,提升实际教学效果。由于有着相似的研究目标,这两类领域的研究人员存在 着大量的重叠,共同致力于更好地理解学习者的认知过程,并利用各种手段提高学习 者的认知效率以及认知深度。匹兹堡大学和卡内基梅隆大学成立的 Learning Research & Development Center 和 Pittsburgh Science of Learning Center 成为了众多“人工智能 + 教育” 研究者成长的摇篮。 与国际上“人工智能 + 教育”研究的发展不尽相同,国内“人工智能 + 教育”的 发展,更多得益于近几年工业界在人工智能和互联网应用的跳跃式发展,以及市场上对 教育类应用的巨大需求。因此,国内的“人工智能 + 教育”的发展更多地体现在工业界, 进入大众和研究者视野的应用,更多的是迎合应试类和校园服务类需求,比如自动判分、 自动搜题、练习智能推送、刷脸校园签到等,产生了一些优秀的工程类研究成果,但相 对于学习者认知过程的科学研究较少。国家自然科学基金委于 2018 年设立了 F0701 的 新代码,旨在加强教育与信息技术深度融合跨学科的科学研究,相信未来国内在技术场 景下学习认知过程的研究会越来越丰富。 如上所述,智能导学系统的演化,以及近年学习分析和教育数据挖掘的兴起,比 较好地反映了人工智能与教育融合的发展历程。另外,本文还以文本答案自动评价这个 具体应用领域为例,简述了人工智能相关技术的应用发展。 “人工智能 + 教育”的发展历史与研究进展 9
人工智能|产业分析 、智能导学系统的发展历史 智能导学系统主要定位在通过个性化学习,辅助学生在课后学习的同时,提高其 学习效果。建立高效智能导学系统的核心前提之一,便是有效地理解人类的一对一教 学。在上世纪80年代,伴随着人工智能的第二次高潮,计算机和认知科学研究领域涌 现了大批认知科学与计算机科学交叉的研究[,2]。这里所述的认知科学,偏向于当下 所说的行为认知科学研究。研究者通过建立智能系统,来理解验证认知科学实验的硏 究成果。随着第二次人工智能浪潮的结束,人工智能科学家与认知科学家的合作渐少, 并形成了各自的领域。但这种早期的合作,仍旧为智能教育的相关研究奠定了良好的 基础,培养了一批跨学科人才,所产出的智能导学系统既能够使用先进的计算机技术 又符合学生的认知规律并实际解决一些教学问题。自上世纪90年代至今,很多成功的 智能导学系统在一定范围内得以推广,并在各类学科教学中显示了其有效性。如教授 物理解题的 Andes[3],教授代数的 Algebra tutor4,以对话形式教授学生信息技术、物 理、生物等学科的 AutoTutor5],以虚拟3D环境辅助学生探究学习的 Crystal island[6] 等。可见,在发展过程中智能导学系统所覆盖的学科不断扩大,有效地帮助研究者们 理解了各学科教学过程以及学生认知的特性。除了所教授学科的拓展,从表现形式上 智能导学系统也从单一地让学生通过练习、解题来学习,衍生出了各种不同的学习方式 包括但不限于 设计可被教学的智能代理,让学生通过教授智能代理知识而进行学习[。其借 鉴了教育心理学中" Learning by teaching”的相关研究。随着机器人技术的发展,亦有 研究者让学生教授实体机器人来进行自身知识的学习与巩固[8 许多研究者提出了游戏化学习理论(Game- based learning),通过设计教育游戏 让学生能够愉悦地进行学习[9]。 让学生通过自然语言的对话形式来进行学习,在对话中融入知识讲授,以及学 生情感关注[0]。 U Anderson, J.R. (2013). The architecture of cognition: Psycholgy Press. [3 Vanlehn, K, Lynch, C Schulze, K Shapiro, J, A, Shelby, R. Taylor, Lm. wintersgill. M. (2005). The Andes physics tutoring system: Lessons leamed, 4 Koedinger, K. R, Anderson, J R, Hadley, W, H Mark, M. A. (1990). Intelligent tutoring goes to school in the big city. Intemational Joumal of Artificial Intelligence in Education (UAIED). 8. 30-45 E Nye, B. D, Graesser, A, C, Hu, x (2014), Auto Tutor and family: A review of 17 years of natural language tutoring Intermational Joumal of Artificial Intelligence in Education, 24(4)./-46 [6] Rowe, J, Mott, B, McQuiggan, S, Robison, J Lee, S Lester, J, (200g), Crystal island: A narrative-centered leaming environment for eighth grad microbiology. Paper presented at the workshop on intelligent educational games at the 14th intemational conference on artificial intelligence in education, Brighton, UK(pp. 11-20) Biswas, G, Segedy, J. R& Bunchongchit, K, (2016). From design to implementation to practice a leaming by teaching system: Bettys brain. intemational Joumal of Artificial Intelligence in Education, 26(1), 350-364 [8] Werfel, J. (2013), Embodied teachable agents: Learning by teaching robots, Paper presented at the Intelligent Autonomous Systems, The 13th All, A Castellar, E P N, Van looy, J(2016). Assessing the effectiveness of digital game-based leaming: Best practices. Joumal Article). Computers Education, 92, 90-103 10 O Graesser, A C. Lu, s, Jackson, G, T, Mitchell, H, H, Ventura, M, Olney, A. Louwerse, M. M. (2004). Auto Tutor: A tutor with dialogue in natural langge. [oumal Articlel. Behavior Research Methods, Instruments, Computers, 36(2), 180-192 (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
产业分析 二、智能导学系统的发展历史 智能导学系统主要定位在通过个性化学习,辅助学生在课后学习的同时,提高其 学习效果。建立高效智能导学系统的核心前提之一,便是有效地理解人类的一对一教 学。在上世纪 80 年代,伴随着人工智能的第二次高潮,计算机和认知科学研究领域涌 现了大批认知科学与计算机科学交叉的研究 [1,2]。这里所述的认知科学,偏向于当下 所说的行为认知科学研究。研究者通过建立智能系统,来理解验证认知科学实验的研 究成果。随着第二次人工智能浪潮的结束,人工智能科学家与认知科学家的合作渐少, 并形成了各自的领域。但这种早期的合作,仍旧为智能教育的相关研究奠定了良好的 基础,培养了一批跨学科人才,所产出的智能导学系统既能够使用先进的计算机技术, 又符合学生的认知规律并实际解决一些教学问题。自上世纪 90 年代至今,很多成功的 智能导学系统在一定范围内得以推广,并在各类学科教学中显示了其有效性。如教授 物理解题的 Andes[3],教授代数的 Algebra tutor[4],以对话形式教授学生信息技术、物 理、生物等学科的 AutoTutor[5],以虚拟 3D 环境辅助学生探究学习的 Crystal island[6] 等。可见,在发展过程中智能导学系统所覆盖的学科不断扩大,有效地帮助研究者们 理解了各学科教学过程以及学生认知的特性。除了所教授学科的拓展,从表现形式上, 智能导学系统也从单一地让学生通过练习、解题来学习,衍生出了各种不同的学习方式, 包括但不限于: ·设计可被教学的智能代理,让学生通过教授智能代理知识而进行学习 [7]。其借 鉴了教育心理学中“Learning by Teaching”的相关研究。随着机器人技术的发展,亦有 研究者让学生教授实体机器人来进行自身知识的学习与巩固 [8]。 ·许多研究者提出了游戏化学习理论(Game-based Learning),通过设计教育游戏, 让学生能够愉悦地进行学习 [9]。 ·让学生通过自然语言的对话形式来进行学习,在对话中融入知识讲授,以及学 生情感关注 [10]。 [1] Anderson, J. R. (2013). The architecture of cognition: Psychology Press. [2] Chase, W. G., & Simon, H. A. (1973). Perception in chess. Cognitive psychology, 4(1), 55-81 [3] Vanlehn, K., Lynch, C., Schulze, K., Shapiro, J. A., Shelby, R., Taylor, L.,... Wintersgill, M. (2005). The Andes physics tutoring system: Lessons learned. International Journal of Artificial Intelligence in Education, 15(3), 147-204 [4] Koedinger, K. R., Anderson, J. R., Hadley, W. H., & Mark, M. A. (1997). Intelligent tutoring goes to school in the big city. International Journal of Artificial Intelligence in Education (IJAIED), 8, 30-43 [5] Nye, B. D., Graesser, A. C., & Hu, X. (2014). AutoTutor and family: A review of 17 years of natural language tutoring. International Journal of Artificial Intelligence in Education, 24(4), 427-469 [6] Rowe, J., Mott, B., McQuiggan, S., Robison, J., Lee, S.,... Lester, J. (2009). Crystal island: A narrative-centered learning environment for eighth grade microbiology. Paper presented at the workshop on intelligent educational games at the 14th international conference on artificial intelligence in education, Brighton, UK(pp. 11-20). [7] Biswas, G., Segedy, J. R., & Bunchongchit, K. (2016). From design to implementation to practice a learning by teaching system: Betty’s brain. International Journal of Artificial Intelligence in Education, 26(1), 350-364 [8] Werfel, J. (2013). Embodied teachable agents: Learning by teaching robots. Paper presented at the Intelligent Autonomous Systems, The 13th International Conference on. [9] All, A., Castellar, E. P. N., & Van Looy, J. (2016). Assessing the effectiveness of digital game-based learning: Best practices. [Journal Article]. Computers & Education, 92, 90-103 [10] Graesser, A. C., Lu, S., Jackson, G. T., Mitchell, H. H., Ventura, M., Olney, A.,... Louwerse, M. M. (2004). AutoTutor: A tutor with dialogue in natural language. [Journal Article]. Behavior Research Methods, Instruments, & Computers, 36(2), 180-192 10
“人工智能+教育”的发展历史与研究进展 让学生通过建立动态模型,深度理解实际场景中各种不同变量间的动态关系 以提高学生的建模能力[l 每个成功的智能导学系统,都融入了教育学和认知科学的理论,用以设计系统中智 能代理的脚本,使得智能代理可以恰当地选择练习冋题、给出适应性反馈等,并通过建 立相应的学生模型迫踪学生的状态变化。一般而言,有限状态自动机可用于学生行为的 编码,作为学生特定策略的检测器。 Bayes Knowledge Tracing等统计模型可用来跟踪学 生知识点掌握程度的改变情况。 智能导学系统感知学生状态的变化,在发展中也变得更加多模态化,最初的智能导 学系统只能识别规定的文本内容。随着自然语言处理技术的提升,越来越多的智导学系 统开始能够理解学生较为复杂的文本答案,并给予更加精确的反馈]。而成熟的语音 识别技术则能够比较精确地将学生的语音转化为文字,进而使得杋器能够理解学生的语 音信息,并以实际对话的形式进行教学[13]。学生与智能导学系统的交互行为,也被广 泛用于评价学生的知识水平,问题解决能力,以及元认知情况口4。各种流行的数据挖 掘方法,则被用于发现不同类别的行为交互模式,寻找行为模式与学习表现之间的联系 以及触发对特定行为的反馈动作。智能硬件的发展使得近年来各种不同类型的传感器(包 括皮电、人脸情绪识别、鼠标压力等)也被应用在教学场景中,用于捕捉学生的情绪状 态,并根据不同的情绪状态给出适宜的教学指导[5] 综上所述,伴随着智能导学系统的发展,研究者们对于学习者行为和决策的捕捉和 反馈不断细化和多元化,力求在提高学习者知识水平的同时,辅助学习者提升自身学习 的能力,亦可称为元认知能力( Meta-cognition)。一些比较成熟的智能导学系统,做 到了对教育心理学、认知科学理论的融合,并在此基础上,通过引入人工智能发展的新 技术,使得原有的智能导学系统能够获取更多形态的数据,做出更加适宜的教学微决策。 智能导学系统的规模化应用,可能是产学界未来要面对的一个主要问题,这可能牵涉到 智能导学系统与教师协同工作方式的定义 三、学习分析与教育数据挖掘近年的发展 虽然学习分析与教育数据挖掘拥有各自的社区、会议和期刊,但这两个领域在本质 上并没有什么区别,大体都是通过获取并分析学生在学习过程中产生的数据,理解学习 者学习模式并进行相关预测。学习分析的出现稍晩于教育数据挖掘,然而 Google的近 [1] VanLehn, K, Wetzel, J, Grower, S, Van De Sande, B, (2016). Leaming how to construct models of dynamic systems: an initial evaluation of the agoon intel ligent tutoring system, IEEE Transactions on L earning Technologies, 1382, 1 [12] Tansomboon, C. Gerard, L F. Vitale, J M, Linn, M. C (2017), Designing automated guidance to promote productive revision of scien explanations. Intemational Jourmal of Artificial Intelligence in Education, 2r(4). 729-757 13] Janning, R, Schatten, C. Schmidt-Thieme, L,(2015), Recognising perceived task difficulty from speech and pause histograms, Paper presented at e International Workshop on Affect, Meta-Affect, Data and Leaming (AMADL 2015)(p, 14) [4]. I- VanLehn, K. Girard, s, Burleson, W, Chavez-Echeagaray, M, E, Gonzalez-Sanchez J Hidalgo-Pontet, Y (2014). Evaluation of a 15) VanLehn, K. Zhang, L, Burdson, W. Girard, S, Hidago-Pontet, Y (2010). Can an non-cognitive learning companion increase the effectiveness of 11. a meta-cognitive leaning strategy? IEEE Transactions on Leaming Technologies (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
· 让学生通过建立动态模型,深度理解实际场景中各种不同变量间的动态关系 , 以提高学生的建模能力 [11]。 每个成功的智能导学系统,都融入了教育学和认知科学的理论,用以设计系统中智 能代理的脚本,使得智能代理可以恰当地选择练习问题、给出适应性反馈等,并通过建 立相应的学生模型追踪学生的状态变化。一般而言,有限状态自动机可用于学生行为的 编码,作为学生特定策略的检测器。Bayes Knowledge Tracing 等统计模型可用来跟踪学 生知识点掌握程度的改变情况。 智能导学系统感知学生状态的变化,在发展中也变得更加多模态化,最初的智能导 学系统只能识别规定的文本内容。随着自然语言处理技术的提升,越来越多的智导学系 统开始能够理解学生较为复杂的文本答案,并给予更加精确的反馈 [12]。而成熟的语音 识别技术则能够比较精确地将学生的语音转化为文字,进而使得机器能够理解学生的语 音信息,并以实际对话的形式进行教学 [13]。学生与智能导学系统的交互行为,也被广 泛用于评价学生的知识水平,问题解决能力,以及元认知情况 [14]。各种流行的数据挖 掘方法,则被用于发现不同类别的行为交互模式,寻找行为模式与学习表现之间的联系, 以及触发对特定行为的反馈动作。智能硬件的发展使得近年来各种不同类型的传感器(包 括皮电、人脸情绪识别、鼠标压力等)也被应用在教学场景中,用于捕捉学生的情绪状 态,并根据不同的情绪状态给出适宜的教学指导 [15]。 综上所述,伴随着智能导学系统的发展,研究者们对于学习者行为和决策的捕捉和 反馈不断细化和多元化,力求在提高学习者知识水平的同时,辅助学习者提升自身学习 的能力,亦可称为元认知能力(Meta-cognition)。一些比较成熟的智能导学系统,做 到了对教育心理学、认知科学理论的融合,并在此基础上,通过引入人工智能发展的新 技术,使得原有的智能导学系统能够获取更多形态的数据,做出更加适宜的教学微决策。 智能导学系统的规模化应用,可能是产学界未来要面对的一个主要问题,这可能牵涉到 智能导学系统与教师协同工作方式的定义。 三、学习分析与教育数据挖掘近年的发展 虽然学习分析与教育数据挖掘拥有各自的社区、会议和期刊,但这两个领域在本质 上并没有什么区别,大体都是通过获取并分析学生在学习过程中产生的数据,理解学习 者学习模式并进行相关预测。学习分析的出现稍晚于教育数据挖掘,然而 Google 的近 [11] VanLehn, K., Wetzel, J., Grover, S., & Van De Sande, B. (2016). Learning how to construct models of dynamic systems: an initial evaluation of the dragoon intelligent tutoring system. IEEE Transactions on Learning Technologies, 1382, 1 [12] Tansomboon, C., Gerard, L. F., Vitale, J. M., & Linn, M. C. (2017). Designing automated guidance to promote productive revision of science explanations. International Journal of Artificial Intelligence in Education, 27(4), 729-757 [13] Janning, R., Schatten, C., & Schmidt-Thieme, L. (2015). Recognising perceived task difficulty from speech and pause histograms. Paper presented at the International Workshop on Affect, Meta-Affect, Data and Learning (AMADL 2015) (p. 14). [14] Zhang, L., VanLehn, K., Girard, S., Burleson, W., Chavez-Echeagaray, M. E., Gonzalez-Sanchez, J.,... Hidalgo-Pontet, Y. (2014). Evaluation of a meta-tutor for constructing models of dynamic systems. Computers & Education, 75, 196-217 [15] VanLehn, K., Zhang, L., Burlson, W., Girard, S., & Hidago-Pontet, Y. (2017). Can an non-cognitive learning companion increase the effectiveness of a meta-cognitive learning strategy? IEEE Transactions on Learning Technologies 11 “人工智能 + 教育”的发展历史与研究进展
人工智能|产业分析 10年搜索趋势图显示(如图1所示),学习分析( Learning analytics)比教育数据挖掘 ( Educational data mining)更被广泛接受,具有明显的热度增长。因此以下部分会主要 围绕学习分析的发展进行讨论,也同时映射了教育数据挖掘相关研究的变迁。 图1: Learning analytics和 Educational data mining搜索趋势图 国际学习分析社区( SOLAR)对学习分析做出了明确定义:学习分析即测量、收集 分析并报告关于学习者和学习环境的数据,以此来理解和优化学习过程以及学习环境6] 具体来讲,学习分析包括5个方面的内容:(1)解释学习行为;(2)识别高效成功的 学习模式;(3)检测低效错误的学习模式;(4)引入合适的教学干预;(5)帮助学习 者更加清晰地认识到自己的学习进度口7。 在过去的10年,研究者们不断利用数据证据对学习者的学习情况、学习态度、学 习习惯等方面的评估进行探索研究。数据收集手段不断地丰富和多样化,从单一的日志 文件和问卷调查,到近些年的多模态数据(例如,EEG脑电信号、眼动仪、皮电信号、 表情识别等)。数据分析手段也从描述性统计分析,到了近期利用自然语言技术进行语 义理解,以及利用深度神经网络进行学习状态预测等卩8]。可以说学习分析的发展,紧 紧跟随着技术发展的潮流,而且随着5G技术的引人,相信未来学习分析可以利用的数 据类型会进一步丰富,多模态数据的收集与分析也会得到进一步普及。 然而,在技术取得了种种进步的同时,研究者们也越来越意识到学习分析中教 育理论支持的缺乏,致使实验结果的解释常常不够充分[9。而教育理论框架在学习 分析中的缺失,甚至可能导致实验数据以及教学影响因素的误读。在 Mangaroska& Giannakos的综述中发现,许多学习分析的文章都没有考虑或者直接报告学习者的学习 收益( learning gain),偏离了建立学习分析研究的初衷。另外,学习分析的实验设计 也经常不是清晰地建立在一种教学模型之上的[20,这很容易导致后续研究对已有研究 进行大量无意义的重复。学习分析领域通过这10年的发展,成功地将计算科学的软硬 16]Long, P, Siemens, G, Conok, G& Gasevic, D, (2011). Proceedings of the Ist Intemational Conference on Learning Analytics and Knowledge. In LAK 2011 Ist Intemational Conference on Leaming Analytics and Knowledge. [7]Siemens, G Long. P. (2011), Penetrating the Fog: Analytics in Leaming and Education. Educational Review, 465), 30 18] Mangaroska, K, Giannakos, M. N, (In press, Learming analytics for leaming design: A systematic literature review of analytics-driven design to enhance leaming. IEEE Transactions on Leaming Technologies. 9] Gas evic, D, Kovanowic, V. Joksimowic, S. (2010). Piecing the beaming analytics puzzle: a consolidated model of a field of research and practice. Leaming Research and practice, 30), 63-78. 20] Wise, A. F, Zhao, Y.& Hausknecht, S, N. (2014), Learming Analytics for Online Discussions: Embedded and Extracted Approaches. Joumal of Leaming Analytics, 1(2), 48 (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
产业分析 12 10 年搜索趋势图显示(如图 1 所示),学习分析(Learning analytics)比教育数据挖掘 (Educational data mining)更被广泛接受,具有明显的热度增长。因此以下部分会主要 围绕学习分析的发展进行讨论 , 也同时映射了教育数据挖掘相关研究的变迁。 国际学习分析社区(SoLAR)对学习分析做出了明确定义:学习分析即测量、收集、 分析并报告关于学习者和学习环境的数据,以此来理解和优化学习过程以及学习环境[16]。 具体来讲,学习分析包括 5 个方面的内容:(1)解释学习行为;(2)识别高效成功的 学习模式;(3)检测低效错误的学习模式;(4)引入合适的教学干预;(5)帮助学习 者更加清晰地认识到自己的学习进度 [17]。 在过去的 10 年,研究者们不断利用数据证据对学习者的学习情况、学习态度、学 习习惯等方面的评估进行探索研究。数据收集手段不断地丰富和多样化,从单一的日志 文件和问卷调查,到近些年的多模态数据(例如,EEG 脑电信号、眼动仪、皮电信号、 表情识别等)。数据分析手段也从描述性统计分析,到了近期利用自然语言技术进行语 义理解,以及利用深度神经网络进行学习状态预测等 [18]。可以说学习分析的发展,紧 紧跟随着技术发展的潮流,而且随着 5G 技术的引入,相信未来学习分析可以利用的数 据类型会进一步丰富,多模态数据的收集与分析也会得到进一步普及。 然而,在技术取得了种种进步的同时,研究者们也越来越意识到学习分析中教 育理论支持的缺乏,致使实验结果的解释常常不够充分 [19]。而教育理论框架在学习 分析中的缺失,甚至可能导致实验数据以及教学影响因素的误读。在 Mangaroska & Giannakos 的综述中发现,许多学习分析的文章都没有考虑或者直接报告学习者的学习 收益(learning gain),偏离了建立学习分析研究的初衷。另外,学习分析的实验设计 也经常不是清晰地建立在一种教学模型之上的 [20],这很容易导致后续研究对已有研究 进行大量无意义的重复。学习分析领域通过这 10 年的发展,成功地将计算科学的软硬 图 1:Learning analytics 和 Educational data mining 搜索趋势图 [16] Long, P., Siemens, G., Conole, G., & Gašević, D. (2011). Proceedings of the 1st International Conference on Learning Analytics and Knowledge. In LAK 2011 1st International Conference on Learning Analytics and Knowledge. [17] Siemens, G., & Long, P. (2011). Penetrating the Fog: Analytics in Learning and Education. Educational Review, 46(5), 30. [18] Mangaroska, K., & Giannakos, M. N. (In press). Learning analytics for learning design: A systematic literature review of analytics-driven design to enhance learning. IEEE Transactions on Learning Technologies. [19] Gašević, D., Kovanović, V., & Joksimović, S. (2017). Piecing the learning analytics puzzle: a consolidated model of a field of research and practice. Learning: Research and Practice, 3(1), 63–78. [20] Wise, A. F., Zhao, Y., & Hausknecht, S. N. (2014). Learning Analytics for Online Discussions: Embedded and Extracted Approaches. Journal of Learning Analytics, 1(2), 48–71
“人工智能+教育”的发展历史与研究进展 件先进技术融入到了教学实验数据分析当中,然而现阶段的结合还稍显表层。 学习分析的发展历史表明,我们对学习者数据类型的获取将不断丰富,数据量也 会越来越大,但我们需要更加关注学习分析背后的教育理论基础,才能使得研究更加 系统化 四、文本答案自动评价 在多数场景中,自动评价实际意味着自动总结性评价,也就是充当自动评分的作 用。而自动评分可能提供两方面的实际应用:一是大规模考试;另外一个是作为智能导 学系统中的测评器。美国教育考试服务机构(ETS)早在2004年便发布了用于短文本 答案自动评分的C- rater以及作文自动评分的E- rater[21],这些自动评分工具被广泛地 用于ETS考试和考试辅导当中。当然,由于ETS考试的高利害特性,笔者并未找到这 些自动评分算法的具体使用方式。大规模考试中的自动评分工具,其最终目标就是将学 生答案根据评分规则,进行精确分类。而学术界的研究者则更希望利用文本答案自动评 分模型,构建适应性学习体验。著名智能导学系统 AutoTutor家族中的测评模块,是这 方面应用的最典型代表。该测评器用于诊断学生对问题的回答并自动分类,以便给予相 应的反馈信息。因此,智能导学系统中的测评器,实际也要完成一个自动分类的任务, 以统计机器学习的视角来看,无论场景如何,自动评分实际完成的是一个分类问题。自 动评分的发展进程,进而可以视为文本自动分类的应用发展历程。随着 Latent semantic Analysis, Latent dirichlet association, Recurrent Neural Network等算法,以及文本编码技 术( word embedding)在自然语言当中的广泛应用,文本答案自动评分的发展也经历着 深刻变迁。 另一方面,在作文自动评价这个特别的场景中,分数总结性评价的意义显得微不足 道,学生更需要对自身作文的形成性评价。近几年,随着优质文本大数据的积累,对第 二语言的作文自动批改,显得愈发成熟。其主要原因是第二语言学习者常常对词语搭配 掌握不好,而许多词语搭配都可通过bi-gram或者ti-gram进行表征。这就使得在大量 优质文本的支持下,计算机可以比较容易地从这些文本中提取出词语搭配的习惯用法 进而给出形成性评价的反馈。当然,作文的自动评价的发展,并不只局限于随着数据集 增大而提高的词语搭配反馈质量,深度学习算法的发展,同样促进了作文中句式批改质 量的提高。 可见,自动评价算法已经可以对语法,尤其是作文当中的语法层面进行比较优质的 批改。虽然国内一些代表性公司的作文自动评分系统显示了基于深度学习的算法已经能 够比较精确地实现对于母语作文的总结性评分,但还是很难在语义层面或內容思想上, [21] Attali, Y, and J, Burstein, AUTOMATED ESSAY SCORING WITH E-RATERoV, 20. ETS Research Report Series. 20042). (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
13 件先进技术融入到了教学实验数据分析当中,然而现阶段的结合还稍显表层。 学习分析的发展历史表明,我们对学习者数据类型的获取将不断丰富,数据量也 会越来越大,但我们需要更加关注学习分析背后的教育理论基础,才能使得研究更加 系统化。 四、文本答案自动评价 在多数场景中,自动评价实际意味着自动总结性评价,也就是充当自动评分的作 用。而自动评分可能提供两方面的实际应用:一是大规模考试;另外一个是作为智能导 学系统中的测评器。美国教育考试服务机构(ETS)早在 2004 年便发布了用于短文本 答案自动评分的 C-rater 以及作文自动评分的 E-rater[21],这些自动评分工具被广泛地 用于 ETS 考试和考试辅导当中。当然,由于 ETS 考试的高利害特性,笔者并未找到这 些自动评分算法的具体使用方式。大规模考试中的自动评分工具,其最终目标就是将学 生答案根据评分规则,进行精确分类。而学术界的研究者则更希望利用文本答案自动评 分模型,构建适应性学习体验。著名智能导学系统 AutoTutor 家族中的测评模块,是这 方面应用的最典型代表。该测评器用于诊断学生对问题的回答并自动分类,以便给予相 应的反馈信息。因此,智能导学系统中的测评器,实际也要完成一个自动分类的任务。 以统计机器学习的视角来看,无论场景如何,自动评分实际完成的是一个分类问题。自 动评分的发展进程,进而可以视为文本自动分类的应用发展历程。随着 Latent Semantic Analysis, Latent Dirichlet Association, Recurrent Neural Network 等算法,以及文本编码技 术(word embedding)在自然语言当中的广泛应用,文本答案自动评分的发展也经历着 深刻变迁。 另一方面,在作文自动评价这个特别的场景中,分数总结性评价的意义显得微不足 道,学生更需要对自身作文的形成性评价。近几年,随着优质文本大数据的积累,对第 二语言的作文自动批改,显得愈发成熟。其主要原因是第二语言学习者常常对词语搭配 掌握不好,而许多词语搭配都可通过 bi-gram 或者 tri-gram 进行表征。这就使得在大量 优质文本的支持下,计算机可以比较容易地从这些文本中提取出词语搭配的习惯用法, 进而给出形成性评价的反馈。当然,作文的自动评价的发展,并不只局限于随着数据集 增大而提高的词语搭配反馈质量,深度学习算法的发展,同样促进了作文中句式批改质 量的提高。 可见,自动评价算法已经可以对语法,尤其是作文当中的语法层面进行比较优质的 批改。虽然国内一些代表性公司的作文自动评分系统显示了基于深度学习的算法已经能 够比较精确地实现对于母语作文的总结性评分,但还是很难在语义层面或内容思想上, [21] Attali, Y. and J. Burstein, AUTOMATED ESSAY SCORING WITH E‐RATER® V. 2.0. ETS Research Report Series. 2004(2). “人工智能 + 教育”的发展历史与研究进展
人工智能|产业分析 给予学习者足够的帮助。如果想让学习者获得文本内容上的帮助,现阶介段还是需要自动 评价算法结合智能导学系统的设计,才可能比较好地实现。 五、结语 通过对“人工智能+教育”领域历史发展中一些典型类别研究的回顾,我们发现 这个跨学科领域越来越强调教育与技术的深度融合。而这两方面的融合,需要更多地培 养教育和计算机研究的跨学科人才。现阶段,虽然“人工智能+教育”的火热成就了 一批创业企业,然而市场上的教育产品多以利益驱动解决教育环节中的一些相对独立的 市场需求,如快速得到题目答案、自动批阅、监控课堂情况等。虽然这些独立的产品能 够解决教学中某些环节的自动化问题,但并不能帮助我们更好地理解学生是如何学习 的,我们依然受困于如何使得学生更有效、更有深度地学习。期望“人工智能+教育” 的研究,未来能够更加地系统化,结合已有教育教学理论,对离散的、相对独立的技术 进行整合,帮助我们更好地理解学生学习的过程,并帮助学生更加高效地学习,促进建 模能力、实际问题解决能力、协作能力等高阶能力的培养。 查看内容精选 (c)1994-2019ChinaAcademicJOurnalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
产业分析 14 给予学习者足够的帮助。如果想让学习者获得文本内容上的帮助,现阶段还是需要自动 评价算法结合智能导学系统的设计,才可能比较好地实现。 五、结语 通过对“人工智能 + 教育”领域历史发展中一些典型类别研究的回顾,我们发现, 这个跨学科领域越来越强调教育与技术的深度融合。而这两方面的融合,需要更多地培 养教育和计算机研究的跨学科人才。现阶段,虽然“人工智能 + 教育”的火热成就了 一批创业企业,然而市场上的教育产品多以利益驱动解决教育环节中的一些相对独立的 市场需求,如快速得到题目答案、自动批阅、监控课堂情况等。虽然这些独立的产品能 够解决教学中某些环节的自动化问题,但并不能帮助我们更好地理解学生是如何学习 的,我们依然受困于如何使得学生更有效、更有深度地学习。期望“人工智能 + 教育” 的研究,未来能够更加地系统化,结合已有教育教学理论,对离散的、相对独立的技术 进行整合,帮助我们更好地理解学生学习的过程,并帮助学生更加高效地学习,促进建 模能力、实际问题解决能力、协作能力等高阶能力的培养。 查看内容精选