需求抽取(Ⅱ) 认知的方法 上下文方法 民族学作为一种需求工程技术
需求抽取(II) 认知的方法 上下文方法 民族学作为一种需求工程技术
知识工程的困难 ◆将领域知识和运作知识分离 建模的问题 ■脆弱性 ■合理性假设 表示的问题 认识论的不适当性 ■表达能力和可获取性 专家的偏见
知识工程的困难 将领域知识和运作知识分离 建模的问题 ◼ 脆弱性 ◼ 合理性假设 表示的问题 ◼ 认识论的不适当性 ◼ 表达能力和可获取性 专家的偏见
需求抽取和知识抽取 ◆区别:知识抽取涉及发现‘专家’知识, 需求抽取涉及发现领域知识 ◆需求抽取原理上与知识抽取是类似的 拥有共同的困难 ◆借鉴和利用知识工程的研究成果和经验
需求抽取和知识抽取 区别:知识抽取涉及发现‘专家’知识, 需求抽取涉及发现领域知识 需求抽取原理上与知识抽取是类似的 拥有共同的困难 借鉴和利用知识工程的研究成果和经验
知识抽取技术的发展背景 成长于80年代关于专家系统的工作 n最初关注于为基于规则的系统,设计专 家的启发式规则 后来,针对不同的知识(包括领域不同 用途不同、形式不同),提出不同的知 识表示语言,和不同的推理机制 近期,更关注于问题求解方法
知识抽取技术的发展背景 ◼ 成长于80年代关于专家系统的工作 ◼ 最初关注于为基于规则的系统,设计专 家的启发式规则 ◼ 后来,针对不同的知识(包括领域不同、 用途不同、形式不同),提出不同的知 识表示语言,和不同的推理机制 ◼ 近期,更关注于问题求解方法
知识抽取客观上的困难 专家不习惯描述他们做什么 学习的三步曲 ●认知—任务在文字上的复述 ●联想——通过重复进一步加强,文字媒体消失 ●自发—被编译的,无意识地运用 过程性和描述性是不同机制 ●通过重复应用,描述性知识变成过程性知识——专家失去了 对他们知道什么的意识,并且不能够可靠地反省出来 ●专家对更高级的认知过程具有很少或几乎没有任何意识
知识抽取客观上的困难 专家不习惯描述他们做什么 ◼ 学习的三步曲 ⚫ 认知——任务在文字上的复述 ⚫ 联想——通过重复进一步加强,文字媒体消失 ⚫ 自发——被编译的,无意识地运用 ◼ 过程性和描述性是不同机制 ⚫ 通过重复应用,描述性知识变成过程性知识——专家失去了 对他们知道什么的意识,并且不能够可靠地反省出来 ⚫ 专家对更高级的认知过程具有很少或几乎没有任何意识
知识知识抽取客观上的困难 ◆表示的问题 ■专家没有这样的语言来描述他们的知识 ●不存在任何口语能提供必要的精确表示 ●知识工程师必须和专家一起来创建一种合适的语言 不同的知识表示擅长于表示不同的事情 ●认识论的适当性:这种形式化表达专家的知识合适吗? ◆脆弱性 知识是被创造出来的,不是被抽取出来的 知识模型是现实的抽象,因此不可避免地要带选择性 脆弱性是由简化的假设引起的——作为对增加更多的知识的替代, 一个更好的(或更合理的)模型是需要的
知识知识抽取客观上的困难 表示的问题 ◼ 专家没有这样的语言来描述他们的知识 ⚫ 不存在任何口语能提供必要的精确表示 ⚫ 知识工程师必须和专家一起来创建一种合适的语言 ◼ 不同的知识表示擅长于表示不同的事情 ⚫ 认识论的适当性:这种形式化表达专家的知识合适吗? 脆弱性 ◼ 知识是被创造出来的,不是被抽取出来的 ⚫ 知识模型是现实的抽象,因此不可避免地要带选择性 ⚫ 脆弱性是由简化的假设引起的——作为对增加更多的知识的替代, 一个更好的(或更合理的)模型是需要的
专家的偏见 什么是偏见? ■偏见只在关系到某个参考点时存在 ●能够说“无偏见的”吗?(反映现实或真理) ■我们不能直接感知现实 现实通过心理模型的过滤后得到解释 ●并通过我们的感觉和神经中枢作为载体来传播 所以的决策都是部分地基于个人价值系统的 ◆偏见的类型 动机上的偏见 ●专家乐意讨好交谈者或某些其他的听众 认知上的偏见 专家不遵循客观的规则或标准
专家的偏见 什么是偏见? ◼ 偏见只在关系到某个参考点时存在 ⚫ 能够说“无偏见的”吗?(反映现实或真理) ◼ 我们不能直接感知现实 ⚫ 现实通过心理模型的过滤后得到解释 ⚫ 并通过我们的感觉和神经中枢作为载体来传播 ◼ 所以的决策都是部分地基于个人价值系统的 偏见的类型 ◼ 动机上的偏见 ⚫ 专家乐意讨好交谈者或某些其他的听众 ◼ 认知上的偏见 ⚫ 专家不遵循客观的规则或标准
偏见的来源 社会压力 错误的表达 作为对来自交谈者的言语的或非 言语的线索的反应 专家不能准确地按要求的响应模 式给出反应 组思考 思维定势 作为对其他专家的反应的反应 ◆印象管理 旦一个初步的解决方案给出 与之相矛盾的数据就被忽略了 作为对主管、客户等的想象中的 反应的反应 不一致性 带愿望的思考 以前制定的假设被忘记了 作为对希望或可能的收益的反应 存在性 错误的解释 些数据比其它一些数据更容易 分析员选择性地进行解释,以支 被招回 持她当前的信念 不确定性的过低估计
偏见的来源 社会压力 ◼ 作为对来自交谈者的言语的或非 言语的线索的反应 组思考 ◼ 作为对其他专家的反应的反应 印象管理 ◼ 作为对主管、客户等的想象中的 反应的反应 带愿望的思考 ◼ 作为对希望或可能的收益的反应 错误的解释 ◼ 分析员选择性地进行解释,以支 持她当前的信念 错误的表达 ◼ 专家不能准确地按要求的响应模 式给出反应 思维定势 ◼ 一旦一个初步的解决方案给出, 与之相矛盾的数据就被忽略了 不一致性 ◼ 以前制定的假设被忘记了 存在性 ◼ 一些数据比其它一些数据更容易 被招回 不确定性的过低估计
可获取性和表达能力 Form-Filling Interfaces Ideal Representation Rule-Induction ○ interfaces Spreadsheet Programs Expert System Shells Logic Program Environments Expressiveness
可获取性和表达能力
知识的层次 将知识建模看作: ■将一个 Agenti的行为作为 知识层模型 个黑盒子来观察 环境 ●它就像拥有关于它的环境 合理化 的,并且它能够合理地使 用的知识那样行为 ●它采取行为来实现事先给 行为观察 观察者 (建模者) 定的目标 ■构造两个模型 机械化 ●符号层次:机械化行为的 描述 知识层次:这个 Agent关于 符号层模型 世界的知识的描述
知识的层次 将知识建模看作: ◼ 将一个Agent的行为作为一 个黑盒子来观察 ⚫ 它就像拥有关于它的环境 的,并且它能够合理地使 用的知识那样行为 ⚫ 它采取行为来实现事先给 定的目标 ◼ 构造两个模型 ⚫ 符号层次:机械化行为的 描述 ⚫ 知识层次:这个Agent关于 世界的知识的描述 环境 行为 知识层模型 符号层模型 观察 观察者 (建模者) 机械化 合理化 Agen t