正在加载图片...
信息检索与数据挖掘 2019年4月9日 6 词项-文档计数(f矩阵C→CCT、CTC 词项-文档权重(fidD矩阵C→CCT、CTC 。物理意义? ·A:是词项在不同文档中出现次数的平方和 ·A是词项和词项j共现时f*tf的累计 习题18-7合 021 C= 0 3 (18-14) 上式为一个词项-文档矩阵,其中每个元素都是词项频率,因此词项1在文档2中出现2次,而 在文档3中出现1次。计算Cc,并找出两个词项的最高词频都出现在同一文档时所对应的元素。 CCT各元素体现了词项和词项之间的关联程度 CTC各元素体现了文档和文档之间的关联程度信息检索与数据挖掘 2019年4月9日 6 词项-文档计数(tf)矩阵C→CCT 、CTC 词项-文档权重(tf-idf)矩阵C→ CCT 、 CTC • 物理意义? • Aii是词项i在不同文档中出现次数的平方和 • Aij是词项i和词项j共现时tfi*tfj的累计 CCT各元素体现了词项和词项之间的关联程度 CTC各元素体现了文档和文档之间的关联程度
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有