算法基础上 ,引入智能控制中的自适应反馈学习机制 ,提出了一种基于向量空

点击下载：智能系统：自适应过滤算法在社区Elearning的个性化服务系统中的研究

正在加载图片...

·92 智能系统学报第3卷算法基础上，引入智能控制中的自适应反馈学习机式中：w:为文档中的第1个词，为第j个主题制，提出了一种基于向量空间模型的教育资源自适 P(w,/)和P(w)采用最大似然法进行估计应过滤算法.该算法在执行过程中，不需要大量的初 3)在获得主题的正例和伪正例向量后，初始模始文本，同时在过滤的过程中可不断的进行自主学板向量是正例特征向量、伪正例特征向量、用户兴趣习来提高过滤精度.将该算法应用于基于社区E 向量和主题向量4个向量的加权和，权重分别为a、 learning的个性化知识服务系统中，能更好地支持 B、Y、6即社区教育的开展 pfo(Q)aPo(Q)BP(Q)+YP2 (Q)P3 (Q) 1 基于向量空间模型的教育资源自适 2) 式中：Q表示主题，Pf(Q是主题Q的初始模板向应过滤算法量，而B、P、B、P是它的4个分量基于向量空间模型的教育资源过滤算法包括训 1.1.2初始模板的建立练和过滤2个阶段.训练阶段的目的是根据给定的教育资源训练集中，比该主题模板的相似度大教育资源训练文本，生成初始的过滤模板，并决定初的阈值的文档将作为该主题的相关文本而检出.计始的阈值.在自适应过滤阶段，对于教育资源中的每算初始模块向量和全部训练样本之间的相似度，可篇文本，系统判断它是否和过滤模板相关，再根据用以为每个主题选择最优的初始相似度阈值.相似度户的反馈信息，自动调整过滤模板和阈值，以获得最采用余弦公式进行计算，如式3所示佳的过滤性能 ∑dpfk 1.1训练 sim(d.pr) (3) 图1说明了训练算法的流程图.首先，将主题转 hpri 变为向量形式，同时从正例文本和伪正例文本中抽式中：p表示初始模块向量，d表示文本.d是d中取特征向量.而初始的模板则是正例特征向量和伪第k个词的权重1 正例特征向量的加权和.于是，就可以计算初始模块 1.2过滤向量和全部的训练样本之间的相似度，从而为每个 1.2.1自适应过滤算法主题选择最优的初始相似度阈值初始的过滤模板建立，并且设置好初始阈值之主题用户兴趣模型正例正文伪正例文本后，过滤的过程就是自适应地修改过滤模板和阈值，使过滤性能不断提高，是一个机器学习的过程.图2 主题处理特征提取是自适应过滤算法流程图.对于教学资源的每个文题向量特征向量本，可计算它和某个主题的模板向量的相似度.若相似度大于阈值，就被认为是相关文本.然后由用户判相似度计算教学资源断这篇文本是否真正与主题相关.根据不同的结果初始模板训练集相应地修改模板向量或调整阈值初始倒值正例文本图1训练算法流程图 Fig.1 The flow chart of training algorithm 主题向量特征向量特征提取是 1.1.1初始模板的建立慎板 1)对于每个主题，只能得到少的正例文本.因伪正例文本此需加入伪反馈的功能，从训练文本中挖掘出更教学资相似度>圆值多的相关文本来补充正例文本，和模板向量具有是否成立相似度计算高度相似度而不是给定的正例文本的那些作为伪倒值调整正例文本圆值 2)获得正例文本和伪正例文本后，采用计算互信息量的方法计算每个词的权重图2自适应算法流程图 log MI(w.)=log(p (1) Fig.2 The flow chart of training algorithm P(wi) 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net算法基础上 ,引入智能控制中的自适应反馈学习机制 ,提出了一种基于向量空间模型的教育资源自适应过滤算法. 该算法在执行过程中 ,不需要大量的初始文本 ,同时在过滤的过程中可不断的进行自主学习来提高过滤精度. 将该算法应用于基于社区 E2 learning 的个性化知识服务系统中 ,能更好地支持社区教育的开展. 1 基于向量空间模型的教育资源自适应过滤算法基于向量空间模型的教育资源过滤算法包括训练和过滤 2 个阶段. 训练阶段的目的是根据给定的教育资源训练文本 ,生成初始的过滤模板 ,并决定初始的阈值. 在自适应过滤阶段 ,对于教育资源中的每篇文本 ,系统判断它是否和过滤模板相关 ,再根据用户的反馈信息 ,自动调整过滤模板和阈值 ,以获得最佳的过滤性能. 1. 1 训练图 1 说明了训练算法的流程图. 首先 ,将主题转变为向量形式 ,同时从正例文本和伪正例文本中抽取特征向量. 而初始的模板则是正例特征向量和伪正例特征向量的加权和. 于是 ,就可以计算初始模块向量和全部的训练样本之间的相似度 ,从而为每个主题选择最优的初始相似度阈值. 图 1 训练算法流程图 Fig. 1 The flow chart of training algorithm 1. 1. 1 初始模板的建立 1) 对于每个主题 ,只能得到少的正例文本. 因此需加入伪反馈的功能 ,从训练文本中挖掘出更多的相关文本来补充正例文本 ,和模板向量具有高度相似度而不是给定的正例文本的那些作为伪正例文本. 2) 获得正例文本和伪正例文本后 ,采用计算互信息量的方法计算每个词的权重[5 ] . log MI( wi , tj) = log ( P( wi / tj) ) P( wi) . (1) 式中 :wi 为文档中的第 i 个词 , tj 为第 j 个主题. P( wj / tj) 和 P( wi) 采用最大似然法进行估计. 3) 在获得主题的正例和伪正例向量后 , 初始模板向量是正例特征向量、伪正例特征向量、用户兴趣向量和主题向量 4 个向量的加权和 ,权重分别为α、 β、γ、δ即 pf 0 (Q) =αP0 ( Q) +βP1 ( Q) +γP2 (Q) +δP3 ( Q) . (2) 式中 :Q 表示主题 , Pf 0 ( Q) 是主题 Q 的初始模板向量 ,而 P0 、P1 、P2 、P3 是它的 4 个分量. 1. 1. 2 初始模板的建立教育资源训练集中 ,比该主题模板的相似度大的阈值的文档将作为该主题的相关文本而检出. 计算初始模块向量和全部训练样本之间的相似度 ,可以为每个主题选择最优的初始相似度阈值. 相似度采用余弦公式进行计算 ,如式 3 所示. sim( d , pf ) = ∑k d k p f k ∑k d 2 k ∑k p f 2 k . (3) 式中 : pf 表示初始模块向量 , d 表示文本. dk 是 d 中第 k 个词的权重[6 ] . 1. 2 过滤 1. 2. 1 自适应过滤算法初始的过滤模板建立 ,并且设置好初始阈值之后 ,过滤的过程就是自适应地修改过滤模板和阈值 , 使过滤性能不断提高 ,是一个机器学习的过程. 图 2 是自适应过滤算法流程图. 对于教学资源的每个文本 ,可计算它和某个主题的模板向量的相似度. 若相似度大于阈值 ,就被认为是相关文本. 然后由用户判断这篇文本是否真正与主题相关. 根据不同的结果相应地修改模板向量或调整阈值. 图 2 自适应算法流程图 Fig. 2 The flow chart of training algorithm · 29 · 智能系统学报第 3 卷

<<向上翻页向下翻页>>

点击下载：智能系统：自适应过滤算法在社区Elearning的个性化服务系统中的研究