正在加载图片...
信息检索与数据挖掘 2019/3/16 7 回顾:idf权重 ·df,是出现词项t的文档数目 ·df,是和词项t的信息量成反比的一个值 ·于是可以定义词项t的idf权重: N idf=og.) (其中W是文档集中文档的数目) ·idf,是反映词项t的信息量的一个指标 逆文档频率:多个文档中都会出现的常见词、高频词idf较 低;反之罕见词的idf高信息检索与数据挖掘 2019/3/16 7 回顾:idf权重 • dft 是出现词项t的文档数目 • dft 是和词项t的信息量成反比的一个值 • 于是可以定义词项t的idf权重: (其中N 是文档集中文档的数目) • idft 是反映词项t的信息量的一个指标 7 逆文档频率:多个文档中都会出现的常见词、高频词idf较 低;反之罕见词的idf高 𝑖𝑑𝑓𝑡 = 𝑙𝑜𝑔10( 𝑁 𝑑𝑓𝑡 )
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有