正在加载图片...
·1122· 智能系统学报 第16卷 },这里k为超参数,具体数值通过经验或实验 在测试集上感兴趣的资源的交集与学习者在测试 验证给出。 集上感兴趣的资源的比率,即 2)融合认知水平特征的相似度计算 R-∑IRu)nTuW∑IT(l 将学习者wm在已学习过的知识点上的认知水 平的集合表示为L(m)={L(um)=k14m,h4n),(k24m 式中:R(0)表示推荐产生的学习资源:T()表示学 h2山m),…,(k4n,hm)》。其中,k4m表示学习者4m掌 习者在测试集上关注的学习资源。随着学习资源 握的第j个知识点;h,lm表示对第j个知识点的学 推荐个数的增多,准确率会有所下降,但是召回 习者4m的掌握程度,即认知水平。使用余弦相似 率有所上升。对测试集所有学习者的上述度量求 度计算公式计算学习者的认知水平相似度,构建 均值计算平均准确率AP和平均召回率AR,引入 出与目标学习者认知水平特征最为相似的近邻学 F,值度量整体推荐方法的性能,F,值越大,表示 习者集合,学习者um和u,的认知水平相似度计算 该推荐方法性能越好,F值计算公式为 F,=2×APx AR/(AP+AR) 公式为 33实验结果与分析 本文构建的学习者模型包括静态特征和动态 UmUn sim(umun)evel= uu 特征,其中,静态特征包括静态兴趣偏好特征和 静态学习风格特征;动态特征包括动态兴趣偏好 3)学习者动态综合特征相似度计算 特征和动态认知水平特征。从验证融合学习者特 将2种动态特征相似度加权,计算出学习者 征算法有效性角度出发,首先基于学习者对学习 的动态综合特征相似度。设置参数B调整融合比 资源的评分矩阵,实现了基于经典协同过滤的推 例,具体计算公式为 荐。在此基础上融合各项动静态特征,本文的经 Sim(um,Un)statie= 典协同过滤算法采用文献2]中的通过构建“用户- Bsim(um,u)interesupdata+(1-B)sim(um,u)style upata 项目”评分矩阵计算用户相似度,匹配近邻用户进 行推荐的方法。 3实验结果与分析 1)融合学习者静态特征实验分析 3.1实验数据集 基于协同过滤方法,融合学习者静态特征,在 以超星为在线学习资源推荐研究依托平台, 学习资源推荐个数为5、10、15、20、25、30、35时 《C程序设计》课程的学习资料为学习资源,东 的准确率、召回率和F,值比较如图3所示。通过 北石油大学《C程序设计》学习者2020年3月 实验结果可知,对比于只依靠学习者对学习资源 到2020年7月时间段的学生的真实学习行为为 评分矩阵的经典协同过滤推荐,融合了学习者模 数据开展实验,数据集中主要有3类文件:1)学 型的单项的静态特征会提高整体推荐的性能,但 习者特征中的静态数据文件,包括学生基本信 是单项实验并不会得出哪个特征对推荐结果的影 息、学习风格信息和学习兴趣信息;2)学习者特 响更大,而且多项特征的融合效果也不会通过单 征中的动态数据文件,包括知识点测评信息,学 项实验得到,因此多项特征的融合参数如何选择 习资源浏览、收藏、下载、评价和分享行为数据; 也是要解决的问题。 3)带有标签信息的学习资源数据。原始数据经过 实验中涉及学习资源推荐个数k的实验参数 数据预处理后,共计数据20547条,学生849人, 和静态兴趣偏好特征与静态学习风格特征相融合 学习资源19876个,其中静态数据8567条,动态 的权重系数a。实验过程中,先定义推荐的学习 数据11980条。将数据集按照4:1的比例分为训 资源个数为5个,再对融合参数a取值从0.1~1的 练集和测试集进行模型的训练和测试。 推荐结果计算准确率和召回率的F,值,如图4所 3.2评价标准 示。当α取值为0.6时F值最高(见图4),因此在 准确率、召回率、F,是常用的用于评价推荐性 后续测试结果中令a=0.6,再通过实验测试对比分 能的评价标准。准确率是系统推荐给学习者的资 析融合静态兴趣偏好特征和静态学习风格特征在 源与学习者在测试集上感兴趣的资源的交集和系 不同学习资源推荐个数情况下的准确率和召回率。 统推荐给学习者的资源的比率,即 2)融合学习者动态特征实验分析 P=∑1R(WnTo∑R(ol 学习者动态特征融合包括学习者动态变化的 e 认知水平和学习者对学习资源持续性的学习体现 召回率是系统推荐给学习者的资源和学习者 出的动态兴趣偏好特征。通过多次实验对比分析uk} ,这里 k 为超参数,具体数值通过经验或实验 验证给出。 2)融合认知水平特征的相似度计算 um L(um) = {L(um) = (k1um,h1um),(k2um, h2um),··· ,(kjum,hjum)} kjum um j hjum j um 将学习者 在已学习过的知识点上的认知水 平的集合表示为 。其中, 表示学习者 掌 握的第 个知识点; 表示对第 个知识点的学 习者 的掌握程度,即认知水平。使用余弦相似 度计算公式计算学习者的认知水平相似度,构建 出与目标学习者认知水平特征最为相似的近邻学 习者集合,学习者 um 和 un 的认知水平相似度计算 公式为 sim(um,un)level = um · un |um| · |un| ∑ k hj ,um hj,un √∑ k h 2 j ,um √∑ k h 2 j ,un 3)学习者动态综合特征相似度计算 β 将 2 种动态特征相似度加权,计算出学习者 的动态综合特征相似度。设置参数 调整融合比 例,具体计算公式为 sim(um,un)static = βsim(um,un)interest_updata +(1−β)sim(um,un)style_updata 3 实验结果与分析 3.1 实验数据集 以超星为在线学习资源推荐研究依托平台, 《C 程序设计》课程的学习资料为学习资源,东 北石油大学《C 程序设计》学习者 2020 年 3 月 到 2020 年 7 月时间段的学生的真实学习行为为 数据开展实验,数据集中主要有 3 类文件:1)学 习者特征中的静态数据文件,包括学生基本信 息、学习风格信息和学习兴趣信息;2)学习者特 征中的动态数据文件,包括知识点测评信息,学 习资源浏览、收藏、下载、评价和分享行为数据; 3)带有标签信息的学习资源数据。原始数据经过 数据预处理后,共计数据 20 547 条,学生 849 人, 学习资源 19 876 个,其中静态数据 8 567 条,动态 数据 11 980 条。将数据集按照 4∶1 的比例分为训 练集和测试集进行模型的训练和测试。 3.2 评价标准 准确率、召回率、F1 是常用的用于评价推荐性 能的评价标准。准确率是系统推荐给学习者的资 源与学习者在测试集上感兴趣的资源的交集和系 统推荐给学习者的资源的比率,即 P = ∑ u∈U |R(u)∩T(u)|/ ∑ u∈U |R(u)| 召回率是系统推荐给学习者的资源和学习者 在测试集上感兴趣的资源的交集与学习者在测试 集上感兴趣的资源的比率,即 R = ∑ u∈U |R(u)∩T(u)|/ ∑ u∈U |T(u)| 式中: R(u) 表示推荐产生的学习资源; T(u) 表示学 习者在测试集上关注的学习资源。随着学习资源 推荐个数的增多,准确率会有所下降,但是召回 率有所上升。对测试集所有学习者的上述度量求 均值计算平均准确率 AP 和平均召回率 AR,引入 F1 值度量整体推荐方法的性能,F1 值越大,表示 该推荐方法性能越好,F1 值计算公式为 F1 = 2×AP×AR/(AP+AR) 3.3 实验结果与分析 本文构建的学习者模型包括静态特征和动态 特征,其中,静态特征包括静态兴趣偏好特征和 静态学习风格特征;动态特征包括动态兴趣偏好 特征和动态认知水平特征。从验证融合学习者特 征算法有效性角度出发,首先基于学习者对学习 资源的评分矩阵,实现了基于经典协同过滤的推 荐。在此基础上融合各项动静态特征,本文的经 典协同过滤算法采用文献 [2] 中的通过构建“用户– 项目”评分矩阵计算用户相似度,匹配近邻用户进 行推荐的方法。 1)融合学习者静态特征实验分析 基于协同过滤方法,融合学习者静态特征,在 学习资源推荐个数为 5、10、15、20、25、30、35 时 的准确率、召回率和 F1 值比较如图 3 所示。通过 实验结果可知,对比于只依靠学习者对学习资源 评分矩阵的经典协同过滤推荐,融合了学习者模 型的单项的静态特征会提高整体推荐的性能,但 是单项实验并不会得出哪个特征对推荐结果的影 响更大,而且多项特征的融合效果也不会通过单 项实验得到,因此多项特征的融合参数如何选择 也是要解决的问题。 实验中涉及学习资源推荐个数 k 的实验参数 和静态兴趣偏好特征与静态学习风格特征相融合 的权重系数 α。实验过程中,先定义推荐的学习 资源个数为 5 个,再对融合参数 α 取值从 0.1~1 的 推荐结果计算准确率和召回率的 F1 值,如图 4 所 示。当 α 取值为 0.6 时 F1 值最高 (见图 4),因此在 后续测试结果中令 α=0.6,再通过实验测试对比分 析融合静态兴趣偏好特征和静态学习风格特征在 不同学习资源推荐个数情况下的准确率和召回率。 2)融合学习者动态特征实验分析 学习者动态特征融合包括学习者动态变化的 认知水平和学习者对学习资源持续性的学习体现 出的动态兴趣偏好特征。通过多次实验对比分析 ·1122· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有