信息过滤 刘挺 哈工大信息检索研究室 2004年秋
信息过滤 刘挺 哈工大信息检索研究室 2004年秋
提纲 ·信息过滤概述(概念) 模式匹配(方法) ■垃圾邮件过滤(应用)
提纲 信息过滤概述 (概念) 模式匹配 (方法) 垃圾邮件过滤 (应用)
信息过滤概述
信息过滤概述
信息过滤概述 基本概念
信息过滤概述 ——基本概念
Google推出新闻过滤:https:/www.google.com/accounts/Login tIiu@ir.hit.ed血.cn|设置 Google 管理快讯 创建Google快讯 发送TL格式的电子邮件。改换为文 搜索字词 类型 颊率 新闻 一天一次 您的Google快讯 搜索字词 类型 频率 信息检索哈尔滨工业大学 新闻 一天一次 哈尔滨工业大学 新闻 一天一次 马祖光 新闻 一天一次
Google推出新闻过滤: https://www.google.com/accounts/Login
发伴人 发送时1间:2004-9-23(星期四) 收件人 XGoo2et快讯[goo2 eerts-noreplyegoo2e.con] tliueir.hit.edu cn 抄送 主题 Go。快讯-哈尔滨工业大学 Google快讯-哈尔滨工业大学 为“夕阳”续晚情 人民铁道报(需订阅)-Beijing,China 这趟旅游专列运行1万多公里,行程14天。游客将参观兵马俑、嘉峪关长城、天池、莫高窟、龙门石窟等景点。 加旅游者以文化层次较高的老年游客居多,哈尔滨工业大学等黑龙江省内几所高校均有教授级的老人参团旅游。 拟提职干部公示名单 黑龙江日报-Ha'erbin,.Heilongjiang,China 曹殿富,现任齐齐哈尔市总工会主席、党组书记。男,汉族,中共党员,1948年7月生,1969年12月参加工 哈尔滨工业大学经济管理专业大学毕业(函授),经济师。曾任建华机械厂工人、生产科调度员、调度组长,上 服务公司副科长… 安徽新兴袁立:工大高新股价超跌严重 上海证券报-Shanghai,China 工大高新(600701):控股股东哈尔滨工业大学高新技术开发公司背景雄厚,具有很强的科研开发实力,近年来公司花 股东支持下大举向网络、高科技生物制药、基因工程等领域拓展。公司近年来还积极向生物制药和基因工程发月
发件人 Go1et快讯[googlealerts-noreply0goo1.eon] 发送时间:2004-924星期五】 做伴人 tliulir.hit.edu en 沙关 主题 Goo2le快讯:哈尔滨工业大学 Google快讯-哈尔滨工业大学 工大首创:低价超跌科技股一飞冲天 金融界-Beijing,China 工大首创该股流通盘9150万股,目前股价仅5元多,是两市科技股中价位最低的品种之一。该公司是计算机软作 业的一只生力车,哈尔滨工业大学直属公司哈工大八达集团入主之后,把其控股97.75%的优质资产哈尔滨工业 软件工程有限公司… 查看此主题的所有报道 许继用先进技术打造客户满意度 新浪网-Beijing,China .迫切需要调试、配网自动化产品,便与日立、东艺等公司合作,引进其成熟的配网自动化和调度自动化产品, 时满足了客户的需求。近年来,许继先后与清华大学、哈尔滨工业大学、西安交大、华北电力大学、合肥工业 学 查看此主题的所有报道 中国政治核心世代交替江下胡上 新浪网-Beijing,China .但之前二十馀年都在基层部队工作。徐才厚从哈尔滨车事工程学院电子工程系毕业后,先后在东北某农场劳 炼,任过副指导员、干部处干事、副处长、省车区政治部副主任等职。李继耐毕业于哈尔滨工业大学工程力学系
发件人 iGoo2e快讯[googlealerts-noreplyegoog2e.con] 发送时间:2004-925星期六) 收件人 tliulir.hit.edn cn 抄送」 主题 Go0以。快讯-哈尔滨工业大学 Google快讯-哈尔滨工业大学 马祖光:名利面前一盏灯 文摘报-Beijing,China 马祖光是中国科学院院士、哈尔滨工业大学博士生导师,曾被黑龙江省政府授予特等劳动模范称号,获全国“] 一” 劳动奖章。2003年7月15日,马祖光不幸辞世。1996年,科学家王大珩院士来到哈尔滨… 高校助学贷款调整实施机制 黑龙江日报-Ha'erbin,Heilongjiang.China 本报23日讯今天,中国银行黑龙江省分行与哈尔滨工业大学等3所在哈中央部属院校就国家助学贷款工程全面实 达成协议,这标志着由国家多个部委共同实施的全国116所中央部属高校国家助学贷款工作在我省正式启动。· 查看此主题的所有报道 华西村:共同富裕的典范 新华网-Beijing,.China .而是华西所培养、锻炼出的一大批各类人才。多年来,不仅吸引了海内外的2000多名外地人才,本村的 生也无一例外地回到了故乡。今年刚大学毕业的24岁的梅振华放弃了已考取的哈尔滨工业大学研究生录取和 等企业的邀请…
定义 ■什么是信息过滤? ·是指计算机根据用户提供的一个过滤需求(user Profile),从动态变化的信息流(比如Web,e-mail)中 自动检索出满足用户个性化需求的信息。 ·Profile:一组对用户过滤需求的描述,这种“profile” 描述了用户长期的、稳定的兴趣爱好 ■近义术语 ·信息的选择分发(Selective Dissemination of Information,SDi),来自图书馆领域 :分流(Routing),来自Message Understanding ,Current Awareness,,来自数据挖掘
定义 什么是信息过滤? 是指计算机根据用户提供的一个过滤需求(user Profile),从动态变化的信息流 (比如Web, e-mail) 中 自动检索出满足用户个性化需求的信息。 Profile:一组对用户过滤需求的描述,这种 “profile ” 描述了用户长期的、稳定的兴趣爱好 近义术语 信息的选择分发(Selective Dissemination of Information, SDI),来自图书馆领域 分流 (Routing),来自Message Understanding Current Awareness, 来自数据挖掘
信息过滤的主要特点 ■无结构的或半结构化的数据 。电子邮件是典型的半结构化数据 。结构化的邮件头 。无结构的邮件正文 ■文本数据 ■对用户profile的描述 既可以用来屏蔽有害信息,也可以用来 收集有益信息
信息过滤的主要特点 无结构的或半结构化的数据 电子邮件是典型的半结构化数据 结构化的邮件头 无结构的邮件正文 文本数据 对用户profile的描述 既可以用来屏蔽有害信息,也可以用来 收集有益信息