非监督分类 电子科技大学 师君
电子科技大学 师 君
学习策略 ,学习策略 。监督分类 ·利用“充足”的样本和与之对应的类属信息进行网络训练。 ·充足:各类特征(概率密度函数)由样本点精确表征, ·研究主要关注网络结构和训练过程,使得网络能够反映样 本所蕴含的类属特征
学习策略 ◦ 监督分类 利用“充足”的样本和与之对应的类属信息进行网络训练。 充足:各类特征(概率密度函数)由样本点精确表征, 研究主要关注网络结构和训练过程,使得网络能够反映样 本所蕴含的类属特征
学习策略 类1 ,学习策略 。非监督分类/半监督分类 ·只有少量/没有样本类属信息。 ·少量样本(或初始参数)能反映部分类属特征,但表征不全 面,需要通过在无标签样本集上“合理扩张”(具有“主 观”性),产生与期望一致的类属表征。 ·通过“伪标签”、数据扩增、“一致性准则”等机制合理 扩展训练样本集
学习策略 ◦ 非监督分类/半监督分类 只有少量/没有样本类属信息。 少量样本(或初始参数)能反映部分类属特征,但表征不全 面,需要通过在无标签样本集上“合理扩张”(具有“主 观”性),产生与期望一致的类属表征。 通过“伪标签”、数据扩增、“一致性准则”等机制合理 扩展训练样本集。 类 1
学习策略 ,非监督分类一一不唯一性 。监督分类 ·以已知类属信息作为评价标准评估分类性能优劣 。非监督分类 ·按照“某特性”对样本进行划分,不同的划分反映处样本 不同维度的特性。 。发现特征 ·对事物多角度的划分,往往能更全面的反映事物的特性
非监督分类——不唯一性 ◦ 监督分类 以已知类属信息作为评价标准评估分类性能优劣 ◦ 非监督分类 按照“某特性”对样本进行划分,不同的划分反映处样本 不同维度的特性。 ◦ 发现特征 对事物多角度的划分,往往能更全面的反映事物的特性
学习策略 性别、职业、年龄段、籍贯 等维度对人进行划分 ,非监督分类一一不唯一性
非监督分类——不唯一性 性别、职业、年龄段、籍贯 等维度对人进行划分
全景网www.quanjing.com rad600-02342954
学习策略 MixMatch:A Holistic Approach to Semi-Supervised Learning ,思考题: 。1、阅读文献,了解半监督学习中,如何利用标签样本 和无标签样本扩增样本,如何为扩增样本赋予伪标签, 并构造代价函数进行训练。 the combined loss C for semi-supervised learning is defined as ,u'=MixMatch(,u,T,K,a) (2) CxHp.pa() (3) x,p∈XI 入~Beta(a,a) cu=网 ∑lg-Pmodel(g|u)I3 '=max(X,1-) u,9∈L/ x'=X'x1+(1-)x2 C=Cx+XuLu p'='p1+(1-)p2
思考题: ◦ 1、阅读文献,了解半监督学习中,如何利用标签样本 和无标签样本扩增样本,如何为扩增样本赋予伪标签, 并构造代价函数进行训练
相以性度量 K-Mean分类 自组织映射 图割法
相似性度量 K-Mean分类 自组织映射 图割法
相似性测度 ,距离测度一一 聚类“特性”的描述 。定义在特征空间×特征空间到实数的函数: 1.d(x,y)∈R 2.d(xx)=0 3.d(x,y)=d(y,x) 4.d(x,z)<d(x,y)+d(y,Z)
距离测度——聚类“特性”的描述 ◦ 定义在特征空间×特征空间到实数的函数: 1. ( , ) 2. ( , ) 0 3. ( , ) ( , ) 4. ( , ) ( , ) ( , ) d d d d d d d x y x x x y y x x z x y y z
相似性测度 ,相似性测度 。定义在特征空间×特征空间到实数的函数: 1.s(x,y)∈R 2.s(y,x)≤S(X,X)=So 3.s(X,y)=s(y,x) 4.s(x,y)s(y,z)s s(x,y)+s(y,z)s(x,z)
相似性测度 ◦ 定义在特征空间×特征空间到实数的函数: 0 1. ( , ) 2. ( , ) ( , ) 3. ( , ) ( , ) 4. ( , ) ( , ) ( , ) ( , ) ( , ) s s s s s s s s s s s x y y x x x x y y x x y y z x y y z x z