正在加载图片...
.752 智能系统学报 第11卷 同证据合成的推理方法,表述如下。 据粒计算模型选择的不同,多粒度推理的内涵也有 ①当条件部分为命题的逻辑组合时,整个条件 所不同。从粗糙集角度来看,多粒度推理的主要任 部分的计算: 务是在保持分类能力不变的前提下信息粒和粒空间 f(A.A A2)=minif(A)f(A2) 的约简,而其关键问题在于对约简目标的定义。从 fi(A V A2)=maxif(A)f(A2) 商空间角度来看,推理的主要任务在于如何利用不 ②结论部分的计算,即已知f(A),A一→B(c1, 同商空间之间的层次关系实现基于分层递阶模型的 c2,…,c),计算fi(B)。 信息粒合成。 首先计算基本分配函数m(B),然后计算结论 多粒度推理代表性工作如下:基于一组对原有信 部分命题B的信任函数Bl(B)、似然函数PI(B), 息表覆盖的子系统,梁吉业等在多粒度视角下对 最后计算类概率函数和正确性。 大规模数据进行有效分解,在此基础上提出了一种针 ③独立证据导出统一假设。 对大规模数据的高效的属性约简算法:李进金等[例 如果有n条规则支持同一命题时,根据Demp- 基于不同邻域半径的属性约简效果,提出了基于斯皮 ster组合规则,总的基本概率分配函数m为各规则 尔曼尺距离的约简排序算法:钱宇华等如通过定义 结论得到的基本概率分配函数的正交和。 多粒度空间中粒度重要性,提出了基于分布约简的悲 4.2多粒度下不确定性度量与推理 观多粒度粗糙集粒度约简方法;折延宏等8]提出了 4.2.1多粒度不确定性度量 基于局部最优属性粒度的属性约简方法:邓大勇 多粒度不确定性度量可以评价多粒度的分类质 量以及不同粒度的重要性,是多粒度精准决策的基 等2将信息表划分为多个相关联的子信息系统簇, 础。多粒度不确定性度量方式有多种,目前多以数 提出了基于并行约简的概念漂移探测方法。 字特征的形式表示,是传统单粒度研究意义下的拓 5 粒计算理论应用研究展望 展。常见的度量包括以下几类: 1)以近似分类精度为代表的概念近似刻画不 粒计算,作为人类对复杂问题求解的一种认知 确定性度量: 模式,已经在知识发现、数据挖掘、图像处理等方面 2)以属性重要度为代表的决策知识不确定性 取得了重要的进展,显现出重大的应用价值。下面 度量; 将从大数据分析、计算生物学、社交网络分析、多粒 3)以粒度为代表的多粒度层次不确定性度量。 度联合计算、认知计算以及粒计算形式化描述6个 上述不确定性度量在多粒度研究中因粒计算模 方面展望未来的研究方向。 型选取、定义角度、多粒度构造策略的差异而有所不 5.1大数据分析 同。例如徐伟华[]等研究了多粒度优势粗糙集下 大数据的挑战带来了人工智能技术、存储技术 的近似分类精度度量:梁吉业]等研究了多粒度近 以及下一代网络技术的发展机遇。大数据经常具有 似空间中不确定性度量的粒度单调性保持:王国 多层次或多粒度特性。粒计算已经成为目前发展迅 胤[74]等分析了多粒度概率粗糙集的粒度变化导致 速的海量信息处理模式[别]。在已有粒计算方法处 区域不确定性。 理大规模数据的研究中,如Ruan等[]使用模糊信 不确定性度量的计算策略可以从不同角度展 息粒化方法先对时间序列进行粒化,然后使用SVMs 开。信息嫡是一种有效度量不确定性的工具,刻画 对粒化了的时间序列进行回归分析和预测,提高了 了信息粒度的关于问题求解的信息量。自从苗夺 大规模时间序列分析的速度。 谦[们等将信息熵引入度量粗糙集不确定性以来,被 5.2计算生物学 广泛用于度量信息系统、知识粒度的不确定性,其变 计算生物学与生物信息学的研究内容往往交织 种条件熵、互补嫡、拓扑熵、组合熵等提供了不同的 在一起,都属于交叉学科。在对生物学中信息的采 度量视角。代表性工作有:张清华[31]提出了用信息 集、存储和分析处理基础上,计算生物学主要侧重于 嫡序列度量分层递阶商空间不确定性:米据生等[] 利用数学模型和计算仿真技术对生物学问题进行研 引入知识粒改进了已有融合熵中的非单调性问题; 究。已有研究工作中,如He等s]在由聚类算法所 李华雄等[)给出了多粒度直觉模糊粗糙集下的粗 智能分割的信息粒上建立各个SVM模型进行蛋白 糙熵和信息嫡。 质预测,有效地解决了海量数据的多分类问题。 4.2.2多粒度下不确定性推理 5.3社交网络分析 多粒度的推理是实现精准决策的重要方法,根 通过分析社交树络数据,建立模型,从而挖掘出同证据合成的推理方法,表述如下。 ①当条件部分为命题的逻辑组合时,整个条件 部分的计算: f 1(A1 ∧ A2 ) = min{f 1(A1 ),f 1(A2 )} f 1(A1 ∨ A2 ) = max{f 1(A1 ),f 1(A2 )} ②结论部分的计算,即已知 f 1(A), A → B(c1 , c2 ,…,ck), 计算 f 1(B) 。 首先计算基本分配函数 m(B), 然后计算结论 部分命题 B 的信任函数 Bel(B) 、似然函数 Pl(B), 最后计算类概率函数和正确性。 ③独立证据导出统一假设。 如果有 n 条规则支持同一命题时,根据 Demp⁃ ster 组合规则,总的基本概率分配函数 m 为各规则 结论得到的基本概率分配函数的正交和。 4.2 多粒度下不确定性度量与推理 4.2.1 多粒度不确定性度量 多粒度不确定性度量可以评价多粒度的分类质 量以及不同粒度的重要性,是多粒度精准决策的基 础。 多粒度不确定性度量方式有多种,目前多以数 字特征的形式表示,是传统单粒度研究意义下的拓 展。 常见的度量包括以下几类: 1) 以近似分类精度为代表的概念近似刻画不 确定性度量; 2) 以属性重要度为代表的决策知识不确定性 度量; 3) 以粒度为代表的多粒度层次不确定性度量。 上述不确定性度量在多粒度研究中因粒计算模 型选取、定义角度、多粒度构造策略的差异而有所不 同。 例如徐伟华[72] 等研究了多粒度优势粗糙集下 的近似分类精度度量;梁吉业[73] 等研究了多粒度近 似空间中不确定性度量的粒度单调性保持;王国 胤[7 4 ]等分析了多粒度概率粗糙集的粒度变化导致 区域不确定性。 不确定性度量的计算策略可以从不同角度展 开。 信息熵是一种有效度量不确定性的工具,刻画 了信息粒度的关于问题求解的信息量。 自从苗夺 谦[75]等将信息熵引入度量粗糙集不确定性以来,被 广泛用于度量信息系统、知识粒度的不确定性,其变 种条件熵、互补熵、拓扑熵、组合熵等提供了不同的 度量视角。 代表性工作有:张清华[31] 提出了用信息 熵序列度量分层递阶商空间不确定性;米据生等[76] 引入知识粒改进了已有融合熵中的非单调性问题; 李华雄等[ [77]给出了多粒度直觉模糊粗糙集下的粗 糙熵和信息熵。 4.2.2 多粒度下不确定性推理 多粒度的推理是实现精准决策的重要方法,根 据粒计算模型选择的不同,多粒度推理的内涵也有 所不同。 从粗糙集角度来看,多粒度推理的主要任 务是在保持分类能力不变的前提下信息粒和粒空间 的约简,而其关键问题在于对约简目标的定义。 从 商空间角度来看,推理的主要任务在于如何利用不 同商空间之间的层次关系实现基于分层递阶模型的 信息粒合成。 多粒度推理代表性工作如下:基于一组对原有信 息表覆盖的子系统,梁吉业等 [78] 在多粒度视角下对 大规模数据进行有效分解,在此基础上提出了一种针 对大规模数据的高效的属性约简算法;李进金等[79] 基于不同邻域半径的属性约简效果,提出了基于斯皮 尔曼尺距离的约简排序算法;钱宇华等 [80] 通过定义 多粒度空间中粒度重要性,提出了基于分布约简的悲 观多粒度粗糙集粒度约简方法;折延宏等[81] 提出了 基于局部最优属性粒度的属性约简方法;邓大勇 等 [82]将信息表划分为多个相关联的子信息系统簇, 提出了基于并行约简的概念漂移探测方法。 5 粒计算理论应用研究展望 粒计算,作为人类对复杂问题求解的一种认知 模式,已经在知识发现、数据挖掘、图像处理等方面 取得了重要的进展,显现出重大的应用价值。 下面 将从大数据分析、计算生物学、社交网络分析、多粒 度联合计算、认知计算以及粒计算形式化描述 6 个 方面展望未来的研究方向。 5.1 大数据分析 大数据的挑战带来了人工智能技术、存储技术 以及下一代网络技术的发展机遇。 大数据经常具有 多层次或多粒度特性。 粒计算已经成为目前发展迅 速的海量信息处理模式[83] 。 在已有粒计算方法处 理大规模数据的研究中,如 Ruan 等[84] 使用模糊信 息粒化方法先对时间序列进行粒化,然后使用 SVMs 对粒化了的时间序列进行回归分析和预测,提高了 大规模时间序列分析的速度。 5.2 计算生物学 计算生物学与生物信息学的研究内容往往交织 在一起,都属于交叉学科。 在对生物学中信息的采 集、存储和分析处理基础上,计算生物学主要侧重于 利用数学模型和计算仿真技术对生物学问题进行研 究。 已有研究工作中,如 He 等[85] 在由聚类算法所 智能分割的信息粒上建立各个 SVM 模型进行蛋白 质预测,有效地解决了海量数据的多分类问题。 5.3 社交网络分析 通过分析社交网络数据,建立模型,从而挖掘出 ·752· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有