第十三章:半监督学习
第十三章:半监督学习
背景(半监督学习) 吃 品瓜师
背景(半监督学习) 隔壁老王 品瓜师 吃
背景(半监督学习) (纯)半监督学习 有标记样本 幽xA,「N 待测数据 模型 品瓜师 无标记样本 直推学习
背景(半监督学习) 品瓜师 吃 模型 有标记样本 无标记样本 直推学习 (纯)半监督学习 待测数据
背景(主动学习) 吃 XINHUA 品瓜师
背景(主动学习) 品瓜师 吃
背景(主动学习) 主动学 有标记样 厂层 本 待测数据|L模型 标注者 AYXINHUAI
背景(主动学习) 品瓜师 主动学 习 吃 待测数据 模型 有标记样 本 无标记样本 标注者
未标记样本的效用 ”?“-”? 待判别样本观察到 未标记样本 图13.1未标记样本效用的例示,右边的灰色点表示未标记样本
未标记样本的效用
未标记样本的假设 口要利用未标记样本,必然要做一些将未标记样本所揭示的数据分 布信息与类別标记相联系的假设,其中有两种常见的假设。 ●聚类假设( clustering assumption) 假设数据存在簇结构,同一簇的样本属于同一类别。 ●流形假设( manifold assumption) 假设数据分布在一个流形结构上,邻近的样本具有相似的输出值。 流形假设可看聚类假设的推广
未标记样本的假设 要利用未标记样本,必然要做一些将未标记样本所揭示的数据分 布信息与类别标记相联系的假设,其中有两种常见的假设。 ⚫ 聚类假设(clustering assumption): 假设数据存在簇结构,同一簇的样本属于同一类别。 ⚫ 流形假设(manifold assumption): 假设数据分布在一个流形结构上,邻近的样本具有相似的输出值。 流形假设可看做聚类假设的推广
大纲 口未标记样本 口生成式方法 口半监督SV 口图半监督学习 基于分歧的方法 口半监督聚类
大纲 未标记样本 生成式方法 半监督SVM 图半监督学习 基于分歧的方法 半监督聚类
生成式方法 口假设样本由这个假设意味着混合成分高斯混合模型生成,且每个类别对 应一个高斯混合成分: p(m)=∑;(xp,∑) 其中,a;≥0,∑=10;=1 (cl,∑) (2n)号1e-(m-1)111(m-H1)
生成式方法 假设样本由这个假设意味着混合成分 高斯混合模型生成, 且每个类别对 应一个高斯混合成分: 其中
生成式方法 口由最大化后验概率可知 f(a)=argmaxp(y=j lac ∈ -argmax ply=j, 0=ila) P(y=j0 j∈yi=1 argmax lp(y=j0=i, x).p(0=ilc j∈yi=1 p(=i1x)=、n(四2 =1Qip(c|p2,∑
生成式方法 由最大化后验概率可知: