【人工智能】基于级联宽度学习的多模态材质识别

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：4.91MB

第15卷第4期智能系统学报 Vol.15 No.4 2020年7月 CAAI Transactions on Intelligent Systems Jul.2020 D0L:10.11992tis.201908021 基于级联宽度学习的多模态材质识别王召新，续欣莹，刘华平3，孙富春 (1.太原理工大学电气与动力工程学院，山西太原030600：2.清华大学计算机科学与技术系，北京100084： 3.清华大学智能技术系统国家重点实验室，北京100084) 摘要：材质识别在机器人与周围环境的相互作用中起着至关重要的作用，视觉、触觉和听觉模式可以提供不同材质的不同特性，如何利用不同模态的信号快速、高效地完成材质识别任务是亟待解决的问题。并且在现实应用中，传感器收集的数据量不大，无法为深度神经网络提供足够的数据进行学习训练。为此，本文将级联宽度学习这种泛化性能好的算法应用在小样本的材质识别任务上。首先，将两组同构多模态数据进行特征融合，之后使用级联特征节点的宽度学习进行特征学习，最终得到材质分类结果。最后，针对公开数据开展实验评估。结果表明，本文提出的方法与其他算法相比，在完成材质识别任务的同时，降低了训练时间，提高了分类性能。关键词：级联结构：宽度学习方法：多模态融合：材质识别；光谱数据：同构数据：特征提取：神经网络中图分类号：TP391文献标志码：A文章编号：1673-4785(2020)04-0787-08 中文引用格式：王召新，续欣莹，刘华平，等.基于级联宽度学习的多模态材质识别.智能系统学报，2020,15(4)：787-794. 英文引用格式：VANG Zhaoxin,XU Xinying,LIU Huaping,etal.Cascade broad learning for multi-modal material recognition[J]. CAAI transactions on intelligent systems,2020,15(4):787-794. Cascade broad learning for multi-modal material recognition WANG Zhaoxin',XU Xinying',LIU Huaping2,SUN Fuchun23 (1.College of Electrical and Power Engineering,Taiyuan University of Technology,Taiyuan 030600,China;2.Department of Com- puter Science and Technology,Tsinghua University,Beijing 100084,China;3.State Key Laboratory of Intelligent Technology and System,Tsinghua University,Beijing 100084,China) Abstract:Material recognition plays a vital role in the interaction between the robot and the surrounding environment. The visual,tactile and auditory modalities can provide different properties of various materials.How to use signals of different modalities to complete the task of material identification quickly and efficiently is an urgent problem to be solved.Moreover,in practical applications,the data collected by the sensor is limited,so it cannot provide enough data for deep neural network for learning and training.To this end,this paper applies the cascade broad learning with good generalization performance to the material recognition task of small samples.Firstly,feature fusion of two sets of homo- geneous multi-modal data is carried out,and then feature learning is carried out by using the broad learning of cascad- ing feature nodes,The results show that compared with other methods,the method proposed in this paper reduces the training time and improves the classification performance while completing the material recognition tasks. Keywords:cascade structure;broad learning method;multi-modal fuse;material recognition;spectral data;homogen- eous data;feature extraction:neural network 现实世界是由不同类别的材质组成的，人类微波炉中安全加热，识别物体材质属性有助于人在与外界的交互中，不断评价不同材质表现出来类感知细粒度的世界，然而对机器人来说却极具的特性。比如可以通过材质识别确定物体能否在挑战性山。为了让机器人像人类一样可以观察、收稿日期：2019-08-19. 抚摸和揉捏来感受物体的材质属性，研究者为其基金项目：国家自然科学基金项目(U1613212片山西省自然科配备了各种各样的传感器。但是单一的视觉、触学基金项目(201801D121144,201801D221190). 通信作者：刘华平.E-mail:hpliu(@tsinghua.edu.cn 觉或者听觉信息在材质特征的表达上具有局限

DOI: 10.11992/tis.201908021 基于级联宽度学习的多模态材质识别王召新1 ，续欣莹1 ，刘华平2,3，孙富春2,3 （1. 太原理工大学电气与动力工程学院，山西太原 030600; 2. 清华大学计算机科学与技术系，北京 100084; 3. 清华大学智能技术系统国家重点实验室，北京 100084）摘要：材质识别在机器人与周围环境的相互作用中起着至关重要的作用，视觉、触觉和听觉模式可以提供不同材质的不同特性，如何利用不同模态的信号快速、高效地完成材质识别任务是亟待解决的问题。并且在现实应用中，传感器收集的数据量不大，无法为深度神经网络提供足够的数据进行学习训练。为此，本文将级联宽度学习这种泛化性能好的算法应用在小样本的材质识别任务上。首先，将两组同构多模态数据进行特征融合，之后使用级联特征节点的宽度学习进行特征学习，最终得到材质分类结果。最后，针对公开数据开展实验评估。结果表明，本文提出的方法与其他算法相比，在完成材质识别任务的同时，降低了训练时间，提高了分类性能。关键词：级联结构；宽度学习方法；多模态融合；材质识别；光谱数据；同构数据；特征提取；神经网络中图分类号：TP391 文献标志码：A 文章编号：1673−4785(2020)04−0787−08 中文引用格式：王召新, 续欣莹, 刘华平, 等. 基于级联宽度学习的多模态材质识别 [J]. 智能系统学报, 2020, 15(4): 787–794. 英文引用格式：WANG Zhaoxin, XU Xinying, LIU Huaping, et al. Cascade broad learning for multi-modal material recognition[J]. CAAI transactions on intelligent systems, 2020, 15(4): 787–794. Cascade broad learning for multi-modal material recognition WANG Zhaoxin1 ，XU Xinying1 ，LIU Huaping2,3 ，SUN Fuchun2,3 (1. College of Electrical and Power Engineering, Taiyuan University of Technology, Taiyuan 030600, China; 2. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China; 3. State Key Laboratory of Intelligent Technology and System, Tsinghua University, Beijing 100084, China) Abstract: Material recognition plays a vital role in the interaction between the robot and the surrounding environment. The visual, tactile and auditory modalities can provide different properties of various materials. How to use signals of different modalities to complete the task of material identification quickly and efficiently is an urgent problem to be solved. Moreover, in practical applications, the data collected by the sensor is limited, so it cannot provide enough data for deep neural network for learning and training. To this end, this paper applies the cascade broad learning with good generalization performance to the material recognition task of small samples. Firstly, feature fusion of two sets of homogeneous multi-modal data is carried out, and then feature learning is carried out by using the broad learning of cascading feature nodes, The results show that compared with other methods, the method proposed in this paper reduces the training time and improves the classification performance while completing the material recognition tasks. Keywords: cascade structure; broad learning method; multi-modal fuse; material recognition; spectral data; homogeneous data; feature extraction; neural network 现实世界是由不同类别的材质组成的，人类在与外界的交互中，不断评价不同材质表现出来的特性。比如可以通过材质识别确定物体能否在微波炉中安全加热，识别物体材质属性有助于人类感知细粒度的世界，然而对机器人来说却极具挑战性[1]。为了让机器人像人类一样可以观察、抚摸和揉捏来感受物体的材质属性，研究者为其配备了各种各样的传感器。但是单一的视觉、触觉或者听觉信息在材质特征的表达上具有局限收稿日期：2019−08−19. 基金项目：国家自然科学基金项目 (U1613212)；山西省自然科学基金项目 (201801D121144，201801D221190). 通信作者：刘华平. E-mail：hpliu@tsinghua.edu.cn. 第 15 卷第 4 期智能系统学报 Vol.15 No.4 2020 年 7 月 CAAI Transactions on Intelligent Systems Jul. 2020

·788· 智能系统学报第15卷性，比如仅通过视觉，观察不到物体的硬度和表的信息。因此，开发能够集成来自多个传感器信面粗糙度。多模态数据融合充分利用多种传感器息的方法以提高机器人感知的性能是人们非常期提供的信息，实现不同模态数据优势互补，提高待的。如何有效融合多模态信息以提高感知能了人机交互的多样性、鲁棒性和有效性回，多模态力的问题对研究者来说具有很大的吸引力和挑战特征融合被广泛应用在情感分析)、视频检索性。文献[24]提出了一种视触觉交叉模态检索框触觉物体分类1等领域。近年来，国内外很多学架，将触觉信息与材料表面的视觉信息相关联，者采用多模态融合的方法全面地分析和利用不同用于机器人的感知估计。文献[25]基于宽度学习模态提供的特性完成材质识别任务。文献[6]建方法提出了一个能够学习和融合两种模态特征的立了一种用于弱配对多模态数据融合的投影字典框架用于机器人抓取实验。学习框架，在包含视觉和触觉信息的53个家用物然而，在实际应用中，多模态数据存在异构品上证明了算法的有效性。除了视觉和触觉融合性，不同模态数据具有相关性和模糊性，预处理的情况，使用振动频率和热特征两种触觉模态的数据也具有复杂性2，这些都是制约多模态学习数据融合也可以提高材质识别的准确率)。文的因素。献[8]使用深度全卷积网络对图像数据与加速度 1.2宽度学习数据进行了融合。文献[9]提出了一种半监督的由陈俊龙教授于2017年提出的宽度学习系材料识别方法，使机器人能在与家庭常见物体的统是基于随机向量函数链神经网络(random vec- 交互中学习未标记的力、温度和振动声音3种模 tor functional link neural network.RVFLNN)的思想态的触觉数据。设计的，他为深度学习提供了一个替代的方案。然而，上述研究大多基于深度学习算法，考虑如图1所示，整个网络由4部分组成：输入、特征到深度学习训练时间长，容易得到局部最优解，节点、增强节点和输出。难以收敛，并且在小样本数据的情况下无法发挥其优势。另一方面，宽度学习io(broad learning, 输出层Y BRL)因其结构简单、训练速度快，泛化性能好等优点为深度学习提供了可替代的方案而引起学术界的广泛关注。众多学者针对具体问题的应用背景对宽度学习进行了改进1”，并将其应用在图特征节点层强节点层像识别1、分类和回归1以及数据建模等领域。然而由于其单层前馈神经网络的设计以采用输入样本X 线性映射形成特征节点，很难捕捉到相关的高级图1BRL网络结构抽象特征来完成多种模态数据的材质识别任务。 Fig.1 Modal structure of BRL 因此，本文基于级联宽度学习提出一种多模态材 BRL的基本结构和计算步骤如下，给定输入质识别算法来解决小样本数据集的材质识别问数据为：X∈R,Y∈RxC,首先，生成M组特征映题。首先网络的输入是串联成一个向量的同构数射，每组包含个特征节点，则第i组映射特征表据，然后通过级联宽度学习算法提取融合特征，示为最终得到分类输出，该算法在佐治亚理工学院的 F:=g(X.Wn+B),i=1,2,…,M (1) 光谱数据集上进行验证。实验结果表明，在数据式中：g()是线性激活函数，这使得映射特征为线量较少的情况下，相比于深度学习，本文算法付性特征，在复杂的输入数据处理中，并不能充分出了较少的时间代价并且提高了识别精度，说明地提取有用特征，因此，这给了研究者改进宽度了级联宽度学习方法的快速性和有效性。学习的想法。W:和B,是随机初始化的权重和偏 1 相关工作置，为了克服随机初始化的不可预测性，BRL采用稀疏自编码思想来优化输入权重。接着定义 1.1机器人多模态融合 FM=[F,F2,…,Fw为第i组串联的映射特征，则传感器技术的不断发展推动了多模态传感器第j组的增强节点E,表示为在机器人领域的广泛应用。多模态数据的融合是 E,=g(F.W+Bej=1,2,…,m (2) 将多个传感器的单模态集成到一个紧凑的多模态其中，（是非线性激活函数，这里使用双曲正切表示中的过程2，从而提供比单一模态更有价值函数。W。和B。是增强节点部分的权重和偏置

性，比如仅通过视觉，观察不到物体的硬度和表面粗糙度。多模态数据融合充分利用多种传感器提供的信息，实现不同模态数据优势互补，提高了人机交互的多样性、鲁棒性和有效性[2] ，多模态特征融合被广泛应用在情感分析[3] 、视频检索[4] 、触觉物体分类[5] 等领域。近年来，国内外很多学者采用多模态融合的方法全面地分析和利用不同模态提供的特性完成材质识别任务。文献 [6] 建立了一种用于弱配对多模态数据融合的投影字典学习框架，在包含视觉和触觉信息的 53 个家用物品上证明了算法的有效性。除了视觉和触觉融合的情况，使用振动频率和热特征两种触觉模态的数据融合也可以提高材质识别的准确率[7]。文献 [8] 使用深度全卷积网络对图像数据与加速度数据进行了融合。文献 [9] 提出了一种半监督的材料识别方法，使机器人能在与家庭常见物体的交互中学习未标记的力、温度和振动声音 3 种模态的触觉数据。然而，上述研究大多基于深度学习算法，考虑到深度学习训练时间长，容易得到局部最优解，难以收敛，并且在小样本数据的情况下无法发挥其优势。另一方面，宽度学习[10] (broad learning, BRL) 因其结构简单、训练速度快，泛化性能好等优点为深度学习提供了可替代的方案而引起学术界的广泛关注。众多学者针对具体问题的应用背景对宽度学习进行了改进[11-17] ，并将其应用在图像识别[18] 、分类和回归[19] 以及数据建模[20] 等领域。然而由于其单层前馈神经网络的设计以采用线性映射形成特征节点，很难捕捉到相关的高级抽象特征来完成多种模态数据的材质识别任务。因此，本文基于级联宽度学习提出一种多模态材质识别算法来解决小样本数据集的材质识别问题。首先网络的输入是串联成一个向量的同构数据，然后通过级联宽度学习算法提取融合特征，最终得到分类输出，该算法在佐治亚理工学院的光谱数据集上进行验证。实验结果表明，在数据量较少的情况下，相比于深度学习，本文算法付出了较少的时间代价并且提高了识别精度，说明了级联宽度学习方法的快速性和有效性。 1 相关工作 1.1 机器人多模态融合传感器技术的不断发展推动了多模态传感器在机器人领域的广泛应用。多模态数据的融合是将多个传感器的单模态集成到一个紧凑的多模态表示中的过程[21] ，从而提供比单一模态更有价值的信息。因此，开发能够集成来自多个传感器信息的方法以提高机器人感知的性能是人们非常期待的[23]。如何有效融合多模态信息以提高感知能力的问题对研究者来说具有很大的吸引力和挑战性。文献 [24] 提出了一种视触觉交叉模态检索框架，将触觉信息与材料表面的视觉信息相关联，用于机器人的感知估计。文献 [25] 基于宽度学习方法提出了一个能够学习和融合两种模态特征的框架用于机器人抓取实验。然而，在实际应用中，多模态数据存在异构性，不同模态数据具有相关性和模糊性，预处理数据也具有复杂性[26] ，这些都是制约多模态学习的因素。 1.2 宽度学习由陈俊龙教授于 2017 年提出的宽度学习系统是基于随机向量函数链神经网络 (random vector functional link neural network, RVFLNN) 的思想设计的，他为深度学习提供了一个替代的方案。如图 1 所示，整个网络由 4 部分组成：输入、特征节点、增强节点和输出。输出层 Y ... ... ... ... 输入样本 X 特征节点层增强节点层 M Wm E F M m F1 F2 FM E1 E2 EM 图 1 BRL 网络结构 Fig. 1 Modal structure of BRL X ∈ R A×B ,Y ∈ R A×C M fi i BRL 的基本结构和计算步骤如下，给定输入数据为：，首先，生成组特征映射，每组包含个特征节点，则第组映射特征表示为 Fi = g(X·Wf i +βf i),i = 1,2,··· , M (1) g(·) Wf i βfi F M = [F1,F2,··· ,FM] i j Ej 式中：是线性激活函数，这使得映射特征为线性特征，在复杂的输入数据处理中，并不能充分地提取有用特征，因此，这给了研究者改进宽度学习的想法。和是随机初始化的权重和偏置，为了克服随机初始化的不可预测性，BRL 采用稀疏自编码思想来优化输入权重。接着定义为第组串联的映射特征，则第组的增强节点表示为 Ej = φ(F M ·We j +βe j), j = 1,2,··· ,m (2) φ(·) We j βe j 其中，是非线性激活函数，这里使用双曲正切函数。和是增强节点部分的权重和偏置。 ·788· 智能系统学报第 15 卷

第4期王召新，等：基于级联宽度学习的多模态材质识别 ·789· 类似的，定义m组串联的增强节点为Em= 它们都可以由机器人的末端执行器控制或连 [E,E2,…,Em],因此，BRL的输出可表示为接。光谱仪Lumini ONE有4个光源，波长测量 Y=[F1,F2,…,FME1,E2,…,E]WM= 范围是317~856nm。该光谱仪覆盖了整个可见 [FMIE"]WM =[AM]WM (3) 光光谱以及部分近紫外和近红外光谱。光谱仪其中，W“=[A“]Y是宽度学习的输出矩阵，通过 Scio在评估食品和药品的化学成分等性能方面岭回归的广义逆近似求解得到。而[A“]则采用取得了成功。与Lumini相比，Scio尺寸更小，此式(4)得到：外，Scio的工作在波长为740~1070nm的近红外 [AM]=lim(+A[AMA (4) 光谱范围内。如果测试精度不符合要求或输入新的数据，在这些实验中，两个传感器都与一个位于旋则需要使用增量学习算法扩展网络而无需再转平台上的目标接触，获得理想的光谱测量，以训练。表征最佳的材料识别性能。在数据采集的过程 13级联特征节点的宽度学习中，Lumini的曝光时间是0.5s,可以在信号强度宽度学习是一种灵活的模型，可以在多种约和噪声之间做出合理的权衡。与Lumini不同的束条件下进行改进。级联特征映射的宽度学习是，Scio的曝光时间是不可获取的，但根据经验， (cascade of feature mapping nodes of BRL,CFBRL) 可以发现它的曝光时间约为1s。Scio测量的维是一种改变特征节点连接方式的一种改进结构，度为331(740~1070nm),而Lumini测量的维度如图2所示。将前一组特征节点的输出作为后一为288(317~856nm),在特征学习之前，计算了测组特征节点的输入，以此类推。生成的m组映射量数据的离散一阶导数并进行归一化。特征为[F,F2,…,FMl。以X作为体系结构的输 2.2特征融合入，第1组映射的特性为式(1)中i=1的情况。根据采集数据所用传感器类型的差异，多模接下来，生成第2组映射特性F2。第2组特征节态数据通常可以分为同构数据和异构数据。不同点以映射后的特征F1为输人，生成F2为类型的数据，往往有不同的融合模型2。若多个 F2=g(F1·WB+Bs)= 模态数据具有类似的数学统计规律，称之为同构 g(g(X.W6+B5)W6+B5)= (5) 数据。文中用到的两组数据都是光谱数据，属于 g2(X:(Wn-Bn)=12) 同构数据。因此，学习低层次的相关性可以得到更加鲁棒的特征四。本文将串联的多模态数据作为级联宽度学习网络的输入，然后通过宽度网络输出层Y 提取融合特征，最终得到材质类别。 3实验结果与分析为了验证本文提出的基于级联宽度学习的多模态材质识别算法的有效性，在佐治亚理工学院的材质光谱数据集上展开了实验对比。该数输入样本X 据集的收集工作揭示了一种利用光谱学来估计物体材料的机器人技术。光谱学的研究包括测量电图2 CFBRL网络结构 Fig.2 Modal structure of CFBRI 磁辐射和物质之间的相互作用。通俗地说，这是一个测量物体反射回来的光强度的过程，它是光按照这个规律，可以得到第M组的映射特征：波长的函数。光谱仪（或光谱学传感器）为机器 Fn=g(Fa-1·Wm+Brn= (6) 人的材料识别提供了几个好处，包括具有快速的 g(X:(W,Bl1),n=1,2,…,M 传感能力和精确且可重复的测量。此外，与许多得到映射特征后，生成增强节点和计算输出触觉传感器不同，光谱仪不需要与物体进行直接矩阵的步骤同BRL。的物理接触，这使得机器人在物体接触之前就得 2数据处理及特征提取方法出该物体的材质属性。 3.1实验数据 2.1数据获取及预处理该数据集包含2个子数据集，都是日常生活实验所用的数据来自商用手持微型光谱仪，用品的光谱测量数据，数据采集样本如图3所示

m E m = [E1,E2,··· ,Em] 类似的，定义组串联的增强节点为，因此，BRL 的输出可表示为 Y = [F1,F2,··· ,FM|E1,E2,··· ,Em]WM = [F M|E m ]WM =[A M m ]WM (3) WM = [A M m ] +Y [A M m ] + 其中，是宽度学习的输出矩阵，通过岭回归的广义逆近似求解得到。而则采用式 (4) 得到： [A M m ] +=lim λ→0 (λI+ A M m ·[A M m ] T ) −1 [A M m ] T (4) 如果测试精度不符合要求或输入新的数据，则需要使用增量学习算法扩展网络而无需再训练。 1.3 级联特征节点的宽度学习 m [F1,F2,··· ,FM] X i = 1 F2 F1 F2 宽度学习是一种灵活的模型，可以在多种约束条件下进行改进。级联特征映射的宽度学习 (cascade of feature mapping nodes of BRL, CFBRL) 是一种改变特征节点连接方式的一种改进结构，如图 2 所示。将前一组特征节点的输出作为后一组特征节点的输入，以此类推。生成的组映射特征为。以作为体系结构的输入，第 1 组映射的特性为式 (1) 中的情况。接下来，生成第 2 组映射特性。第 2 组特征节点以映射后的特征为输入，生成为 F2 = g(F1 ·Wf2 +βf2 ) = g(g(X·Wf1 +βf1 )Wf2 +βf2 ) = g 2 ( X;{Wfi ,βfi } i=1,2 ) (5) 输出层 Y ... ... ... ... F1 F2 FM E1 E2 Em 输入样本 X 图 2 CFBRL 网络结构 Fig. 2 Modal structure of CFBRL 按照这个规律，可以得到第 M 组的映射特征： Fn = g(Fn−1 ·Wf n +βf n)= g n ( X;{Wf i,βf i} M i=1 ) , n = 1,2,··· , M (6) 得到映射特征后，生成增强节点和计算输出矩阵的步骤同 BRL。 2 数据处理及特征提取方法 2.1 数据获取及预处理实验所用的数据来自商用手持微型光谱仪， 317∼856 nm 740 ∼ 1 070 nm 它们都可以由机器人的末端执行器控制或连接。光谱仪 Lumini ONE 有 4 个光源，波长测量范围是。该光谱仪覆盖了整个可见光光谱以及部分近紫外和近红外光谱。光谱仪 Scio 在评估食品和药品的化学成分等性能方面取得了成功。与 Lumini 相比，Scio 尺寸更小，此外，Scio 的工作在波长为的近红外光谱范围内。 740 ∼ 1 070 nm 317 ∼ 856 nm 在这些实验中，两个传感器都与一个位于旋转平台上的目标接触，获得理想的光谱测量，以表征最佳的材料识别性能。在数据采集的过程中，Lumini 的曝光时间是 0.5 s，可以在信号强度和噪声之间做出合理的权衡。与 Lumini 不同的是，Scio 的曝光时间是不可获取的，但根据经验，可以发现它的曝光时间约为 1 s。Scio 测量的维度为 331( )，而 Lumini 测量的维度为 288 ( )，在特征学习之前，计算了测量数据的离散一阶导数并进行归一化。 2.2 特征融合根据采集数据所用传感器类型的差异，多模态数据通常可以分为同构数据和异构数据。不同类型的数据，往往有不同的融合模型[21]。若多个模态数据具有类似的数学统计规律，称之为同构数据。文中用到的两组数据都是光谱数据，属于同构数据。因此，学习低层次的相关性可以得到更加鲁棒的特征[22]。本文将串联的多模态数据作为级联宽度学习网络的输入，然后通过宽度网络提取融合特征，最终得到材质类别。 3 实验结果与分析为了验证本文提出的基于级联宽度学习的多模态材质识别算法的有效性，在佐治亚理工学院的材质光谱数据集[18] 上展开了实验对比。该数据集的收集工作揭示了一种利用光谱学来估计物体材料的机器人技术。光谱学的研究包括测量电磁辐射和物质之间的相互作用。通俗地说，这是一个测量物体反射回来的光强度的过程，它是光波长的函数。光谱仪 (或光谱学传感器) 为机器人的材料识别提供了几个好处，包括具有快速的传感能力和精确且可重复的测量。此外，与许多触觉传感器不同，光谱仪不需要与物体进行直接的物理接触，这使得机器人在物体接触之前就得出该物体的材质属性。 3.1 实验数据该数据集包含 2 个子数据集，都是日常生活用品的光谱测量数据，数据采集样本如图 3 所示。第 4 期王召新，等：基于级联宽度学习的多模态材质识别 ·789·

第4期王召新，等：基于级联宽度学习的多模态材质识别 ·791· 这些物体涵盖了金属、塑料、木材、纸和布料实验设置了相同的参数：每个窗口的特征节点数 5种类别，每个光谱仪采集来自5种类别的50个为9，特征节点窗口数为6，增强节点1000，收敛物体信号，每个物体测量100次，2个传感器共计因子0.7，正则化因子1，从表1可以看出，在使用测量10000个光谱数据。数据集样本如图3所多模态样本进行实验时，在每个物体只有一个训示。实验采用5倍交叉验证的方式，即每个子数练样本的情况下，深度学习和宽度学习分别达到据集的训练数据均为4000个测量值，每种材质了92.20%和98.64%的识别精度，可以看出宽度 800个，剩下的1000个测量值为测试数据。为了学习具有良好的泛化能力。随着训练样本的增验证本文提出的算法在小样本数据集上的性能，加，识别精度均有所提高，这说明在实际应用中，实验的训练数据量仅为200个，并且评估了随着如果机器人无法获得大量的光谱学习样本，在小训练样本从每个物体1~4个测量值依次增加，模样本的情况下可以选择宽度学习来完成材质识别型的分类性能如何变化。任务。另一方面，对比5次交叉验证的运行时间， 3.2实验结果从表2可以看到，宽度学习随训练样本增加运行为了检验宽度学习算法在材质识别任务上的时间总共是14s左右，仅仅是深度学习的1/25，宽性能，主要是验证宽度学习算法在该任务中能否度学习不仅避免了深度结构耗时的训练过程，还作为深度学习的替代方法完成识别任务，因此本能较好地完成材质识别任务。这足以说明了宽度文与文献[21]算法做了对比。具体而言，主要在学习方法的快速性和有效性。识别率、训练和测试时间以及参数敏感性等方面表1 当训练样本增加时不同算法在多模态数据上的识做了评估，材质识别实验流程如图4所示。别准确率 Table 1 Recognition accuracy of different algorithms on multi-modal data when training samples in- crease % 每个物体的训练样本数 DL BRL CFBRL LCFBRL ×104 兰2 umn光谱实例-纸板 Scio光谱实例-纸板 92.2094.2398.62 95.84 0.6 0 3 94.4095.7499.84 96.87 0.4 300500700900 70080090010001100 波长/m 2 95.4697.1499.86 98.03 波长/nm 97.2097.8999.84 98.64 ●●● 。●● ●●…●●● 表2当训练样本增加时不同算法在多模态数据上的运 ●●● 5雪●●O 行时间融合节点层 Table 2 Running time of different algorithms on multi- modal data when training samples increase 每个物体的训练样本数 DL BRL CFBRL LCFBRL CFBRL 特征节点层F 35.031.401.45 1.37 E E 3 72.072.922.89 2.73 增强节点层E 106.114.414.35 4.10 4 137.155.275.80 5.46 预测标签Y 图4材质识别任务流程从图5可以看到，在训练样本为50时，4种算 Fig.4 The process of material recognition tasks 法在单模态和多模态数据上的分类精度。整体来对比实验中增加了一种基于宽度学习的改进看，不管是宽度学习还是深度学习算法，多模态算法：宽度学习中级联特征节点与增强节点之间数据结果好于单一模态的分类结果，这证明了多的有限连接(broad learning:the limited connection 模态融合方法在材质识别领域的有效性。 between the groups of cascaded feature nodes and the 为了比较不同参数对CFBRL模型性能的影 enhancement nodes,LCFBRL)具体结构为特征节响，对参数正则化因子C,收敛因子S,特征节点点级联，最后一组特征节点用来生成增强节点。 N,×N2和增强节点N3进行网格搜索。其中，C是对于3种宽度学习算法，为了提高实验的可比性，控制过拟合的参数，S是增强节点的收缩尺度，防

这些物体涵盖了金属、塑料、木材、纸和布料 5 种类别，每个光谱仪采集来自 5 种类别的 50 个物体信号，每个物体测量 100 次，2 个传感器共计测量 10 000 个光谱数据。数据集样本如图 3 所示。实验采用 5 倍交叉验证的方式，即每个子数据集的训练数据均为 4 000个测量值，每种材质 800 个，剩下的 1 000 个测量值为测试数据。为了验证本文提出的算法在小样本数据集上的性能，实验的训练数据量仅为 200 个，并且评估了随着训练样本从每个物体 1~4 个测量值依次增加，模型的分类性能如何变化。 3.2 实验结果为了检验宽度学习算法在材质识别任务上的性能，主要是验证宽度学习算法在该任务中能否作为深度学习的替代方法完成识别任务，因此本文与文献 [21] 算法做了对比。具体而言，主要在识别率、训练和测试时间以及参数敏感性等方面做了评估，材质识别实验流程如图 4 所示。融合节点层 ... ... ... ... ... ... ... ... ... 预测标签 Y CFBRL ... ... 2 1 0 300 500 900 700 相对亮度值 Lumini 光谱实例−纸板波长/nm ×104 0.6 0.5 0.4 700 800 1 000 1 100 900 相对亮度值 Scio 光谱实例−纸板波长/nm F1 E1 EM Fm 特征节点层 Fm 增强节点层 EM 图 4 材质识别任务流程 Fig. 4 The process of material recognition tasks 对比实验中增加了一种基于宽度学习的改进算法：宽度学习中级联特征节点与增强节点之间的有限连接 (broad learning: the limited connection between the groups of cascaded feature nodes and the enhancement nodes, LCFBRL) 具体结构为特征节点级联，最后一组特征节点用来生成增强节点。对于 3 种宽度学习算法，为了提高实验的可比性，实验设置了相同的参数：每个窗口的特征节点数为 9，特征节点窗口数为 6，增强节点 1 000，收敛因子 0.7，正则化因子 1，从表 1 可以看出，在使用多模态样本进行实验时，在每个物体只有一个训练样本的情况下，深度学习和宽度学习分别达到了 92.20% 和 98.64% 的识别精度，可以看出宽度学习具有良好的泛化能力。随着训练样本的增加，识别精度均有所提高，这说明在实际应用中，如果机器人无法获得大量的光谱学习样本，在小样本的情况下可以选择宽度学习来完成材质识别任务。另一方面，对比 5 次交叉验证的运行时间，从表 2 可以看到，宽度学习随训练样本增加运行时间总共是 14 s 左右，仅仅是深度学习的 1/25，宽度学习不仅避免了深度结构耗时的训练过程，还能较好地完成材质识别任务。这足以说明了宽度学习方法的快速性和有效性。表 1 当训练样本增加时不同算法在多模态数据上的识别准确率 Table 1 Recognition accuracy of different algorithms on multi-modal data when training samples increase % 每个物体的训练样本数 DL BRL CFBRL LCFBRL 1 92.20 94.23 98.62 95.84 2 94.40 95.74 99.84 96.87 3 95.46 97.14 99.86 98.03 4 97.20 97.89 99.84 98.64 表 2 当训练样本增加时不同算法在多模态数据上的运行时间 Table 2 Running time of different algorithms on multimodal data when training samples increase s 每个物体的训练样本数 DL BRL CFBRL LCFBRL 1 35.03 1.40 1.45 1.37 2 72.07 2.92 2.89 2.73 3 106.11 4.41 4.35 4.10 4 137.15 5.27 5.80 5.46 从图 5 可以看到，在训练样本为 50 时，4 种算法在单模态和多模态数据上的分类精度。整体来看，不管是宽度学习还是深度学习算法，多模态数据结果好于单一模态的分类结果，这证明了多模态融合方法在材质识别领域的有效性。 N1 ×N2 N3 为了比较不同参数对 CFBRL 模型性能的影响，对参数正则化因子 C，收敛因子 S，特征节点和增强节点进行网格搜索。其中，C 是控制过拟合的参数，S 是增强节点的收缩尺度，防第 4 期王召新，等：基于级联宽度学习的多模态材质识别 ·791·

·792· 智能系统学报第15卷止增强节点过多造成冗余。图6给出了CF 100 BRL算法固定N1XN2=9×5,N3=10O0时C和 S对两个子数据集测试分类准确率的影响趋势。在这里，取每个物体一个样本的情况进行实验。观察图6发现，当C=20时，分类精度最小；从 C=1开始，随着C的减小，分类精度明显有所降 10×10 低，C对于识别率的影响较大，有明显的局部极大 20×10 30×10 值和极小值区域。对比C的取值变化，收敛因子 S对分类准确率的影响不大，随着S的增加，分类 60×10 s006007008009001000 N 精度在平缓波动。总体来看，在C取值不太大的图7 特征节点和增强节点在多模态数据上对CFBRL分情况下，CFBRL算法具有很好的鲁棒性，能够过类准确率的影响趋势滤掉噪声干扰。 Fig.7 Influence trend of feature node and enhancement node on CFBRL classification accuracy in multi- ]Scio☐Lumini modal data 100 Lumini+Scio 最后，从图8中可以看到本文的算法分别在纸、塑料、布料、木材和金属5种材质上的分类性能。布料容易错分成塑料。原因是Scion光谱仪 70 采集到的信号非常相似。这一点可以在图4中得 6 到印证。在实际应用中，可以增加经常混淆的材 50 质的样本数量，来提高识别率。混淆矩阵 1.0 Deep learning BRL CFBRL LCFBRL 塑料 o 0.0 0.0 0.0 0.0 图5每个物体一个训练样本时不同算法的单模态和多 0.8 模态分类准确率布料 0.001 0.95 0.035 0.0 0.014 Fig.5 Single-modal and multi-modal classification accur- 0.6 acy of different algorithms when each object has a 纸 0.0 0.004 0.994 0.0 0.002 training sample 0.4 100 木材 0.0 0.002 0.001 0.997 0.0 0.2 金属 0.0 0.008 0.02 0.001 0.971 95 塑料布料纸木材金属预测值 --C=20 图8每个物体的训练样本数为1时CFBRL混淆矩阵 90 C=220 -= Fig.8 CFBRL confusion matrix when the training sample =20 number of each object is 1 C=20 85 .10.20.30.40.50.60.70.8 4结束语图6参数C和S在多模态数据上对算法CFBRL识别准为了使机器人更好地完成材质识别任务，本确率的影响趋势文采用多模态融合的方法提出了基于级联宽度学 Fig.6 Influence trend of parameters C and S on CFBRL 习的材质识别算法来提高机器人的感知性能。受 recognition accuracy in multimodal data 外界因素限制，当传感器不能获取足够的数据供将C(1)和S0.7)固定，分别在{100,200,300，机器人训练学习时，本文提出的算法可以取代深 400,500,600}和{500,600,700,800,900,1000}范度学习，以较少的时间代价获得高识别率，实验围内对特征节点和增强节点进行参数调节，分类结果验证了该框架在多模态平面材料识别中的有结果如图7所示。随特征节点数量的增加，分类效性，为材料表面的触觉感知提供了一种有效的精度大致呈正态分布，而分类精度跟增强节点数工具，由于其快速性和有效性，该算法可在机器量是正相关的，在N=1000时达到最优结果。人材质识别领域广泛应用

N1 ×N2 = 9×5 N3 = 1 000 C = 2 10 C = 1 止增强节点过多造成冗余。图 6 给出了 C FBRL 算法固定，时 C 和 S 对两个子数据集测试分类准确率的影响趋势。在这里，取每个物体一个样本的情况进行实验。观察图 6 发现，当时，分类精度最小；从开始，随着 C 的减小，分类精度明显有所降低，C 对于识别率的影响较大，有明显的局部极大值和极小值区域。对比 C 的取值变化，收敛因子 S 对分类准确率的影响不大，随着 S 的增加，分类精度在平缓波动。总体来看，在 C 取值不太大的情况下，CFBRL 算法具有很好的鲁棒性，能够过滤掉噪声干扰。 100 90 80 70 60 50 40 30 识别准确率/% Deep learning BRL CFBRL LCFBRL Scio Lumini Lumini+Scio 图 5 每个物体一个训练样本时不同算法的单模态和多模态分类准确率 Fig. 5 Single-modal and multi-modal classification accuracy of different algorithms when each object has a training sample 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 S 85 90 95 100 C=2−30 C=2−20 C=2−10 C=20 C=210 识别准确率/% 图 6 参数 C 和 S 在多模态数据上对算法 CFBRL 识别准确率的影响趋势 Fig. 6 Influence trend of parameters C and S on CFBRL recognition accuracy in multimodal data N3 = 1 000 将 C(1) 和 S(0.7) 固定，分别在{100，200，300， 400，500，600}和{500，600，700，800，900，1 000}范围内对特征节点和增强节点进行参数调节，分类结果如图 7 所示。随特征节点数量的增加，分类精度大致呈正态分布，而分类精度跟增强节点数量是正相关的，在时达到最优结果。 80 85 10×10 90 20×10 95 100 30×10 1 000 N1×N2 40×10 900 N3 800 50×10 700 600 60×10 500 识别准确率/% 图 7 特征节点和增强节点在多模态数据上对 CFBRL 分类准确率的影响趋势 Fig. 7 Influence trend of feature node and enhancement node on CFBRL classification accuracy in multimodal data 最后，从图 8 中可以看到本文的算法分别在纸、塑料、布料、木材和金属 5 种材质上的分类性能。布料容易错分成塑料。原因是 Scion 光谱仪采集到的信号非常相似。这一点可以在图 4 中得到印证。在实际应用中，可以增加经常混淆的材质的样本数量，来提高识别率。 1.0 0.95 0.994 0.997 0.971 0.0 1.0 0.8 0.6 0.4 0.2 0 0.001 0.0 0.004 0.0 0.002 0.001 0.0 0.008 0.02 0.001 0.0 0.002 0.0 0.035 0.0 0.0 0.0 0.014 塑料 0.0 塑料布料纸预测值真实值木材金属布料纸木材金属混淆矩阵图 8 每个物体的训练样本数为 1 时 CFBRL 混淆矩阵 Fig. 8 CFBRL confusion matrix when the training sample number of each object is 1 4 结束语为了使机器人更好地完成材质识别任务，本文采用多模态融合的方法提出了基于级联宽度学习的材质识别算法来提高机器人的感知性能。受外界因素限制，当传感器不能获取足够的数据供机器人训练学习时，本文提出的算法可以取代深度学习，以较少的时间代价获得高识别率，实验结果验证了该框架在多模态平面材料识别中的有效性，为材料表面的触觉感知提供了一种有效的工具，由于其快速性和有效性，该算法可在机器人材质识别领域广泛应用。 ·792· 智能系统学报第 15 卷

第4期王召新，等：基于级联宽度学习的多模态材质识别 ·793· 参考文献： [12]LIU Z,CHEN CL P.Broad learning system:Structural extensions on single-layer and multi-layer neural net- [1]BELL S.UPCHERCH P.SNAVELY N.et al.Material re- works[C]//2017 International Conference on Security cognition in the wild with the materials in context data- Pattern Analysis,and Cybernetics.Shenzhen,China base[C]//Proceedings of the IEEE Conference on Com- 2017:136-141. puter Vision and Pattern Recognition.Massachusetts,Bo- [13]JIN J.LIU Z,CHEN C L P.Discriminative graph regular- ston,2015:3479-3487. ized broad learning system for image recognition[J].Sci- [2]齐静，徐坤，丁希仑.机器人视觉手势交互技术研究进 ence China information sciences,2018.61(11):112209. 展[U.机器人，2017,39(4)：565-584. [14]CHEN C L P,LIU Z,FENG S.Universal approximation QI Jing.XU Kun,DING Xilun.Vision-based hand gesture capability of broad learning system and its structural vari- recognition for human-robot interaction:a review[J].Ro- ations[J].IEEE transactions on neural networks and learn- bot,2017,394):565-584. ing systems,2018,30(4):1191-1204 [3]吴钟强，张耀文，商琳.基于语义特征的多视图情感分类 [15]LI D.SHUJUAN J,CHUNJIN Z.Improved broad learn- 方法.智能系统学报，2017,12(5)：167-173 ing system:partial weights modification based on BP al- WU Zhongqiang,ZHANG Yaowen,SHANG Lin.Multi- gorithm[J].Materials science and engineering,2018, view sentiment classification of microblogs based on se- 439(3:032083 mantic features[J].CAAI transactions on intelligent sys- [16]ZHANG T L,CHEN R,YANG X,et al.Rich feature tems,2017,12(5):167-173. combination for cost-based broad learning system[J]. [4]温有福，贾彩燕，陈智能.一种多模态融合的网络视频相 IEEE access..2018.7(1):160-172. 关性度量方法).智能系统学报，2016,11(3)：359-365. [17]ZHAO H,ZHENG J,DENG W,et al.Semi-supervised WEN Youfu,JIA Caiyan,CHEN Zhineng.A multi-modal broad learning system based on manifold regularization fusion approach for measuring web video relatedness[J]. and broad network[J].IEEE transactions on circuits and CAAI transactions on intelligent systems,2016,11(3): 359-365. systems I:regular papers,2020,67(3):983-994. [18]KONG Y.WANG X,CHENG Y,et al.Hyperspectral im- [5]马蕊，刘华平，孙富春，等.基于触觉序列的物体分类[，智能系统学报，2015,103)362-368 agery classification based on semi-supervised broad learn- MA Rui,LIU Huaping,SUN Fuchun,et al.Object classi- ing system[J].Remote sensing,2018,10(5):685. [19]FENG S,CHEN C L P.Fuzzy broad learning system:A fication based on the tactile sequence[J].CAAI transac- tions on intelligent systems,2015,10(3):362-368. novel neuro-fuzzy model for regression and classification[J] [6]LIU H,WU Y,SUN F,et al.Weakly paired multimodal IEEE transactions on cybernetics,2018,50(2):414-424. fusion for object recognition[J].IEEE transactions on auto- [20]JIN J,CHEN C L P.Regularized robust broad learning mation science and engineering,2017,15(2):784-795. system for uncertain data modeling[J].Neurocomputing, [7]EGUILUZ A G.RANO I.Coleman S A.et al.A multi- 2018,322(1):58-69 modal approach to continuous material identification [21]LIU Z,SHEN Y,LAKSHMINARASIMHAN V B,et al through tactile sensing[Cl//2016 IEEE/RSJ International Efficient low-rank multimodal fusion with modality-spe- Conference on Intelligent Robots and Systems.Daejeon, cific factors[J].arXiv:1806.00064,2018 Korea,2016:4912-4917. [22]魏洁.深度极限学习机的研究与应用D1.太原：太原理 [8]ZHENG H.FANG L,JI M,et al.Deep learning for sur- 工大学，2016 face material classification using haptic and visual inform- WEI Jie.Research and application of deep extreme learn- ation[J].IEEE transactions on multimedia,2016,18(12): ing machine[D].Taiyuan:Taiyuan University of Techno- 2407-2416. logy,2016. [9]ERICKSON Z,CHERNOVA S,KEMP C.Semi-super- [23]ERICKSON Z.LUSKEY N.CHERNOVA S,et al.Clas- vised haptic material recognition for robots using generat- sification of household materials via spectroscopy[J]. ive adversarial networks[J].arXiv:1707.02796,2017. IEEE robotics and automation letters,2019,4(2): [10]CHEN CL P,LIU Z.Broad learning system:an effective 700-707. and efficient incremental learning system without the [24]ZHENG W.LIU H,WANG B,et al.Cross-modal sur- need for deep architecture[J].IEEE transactions on neural face material retrieval using discriminant adversarial networks and learning systems,2017,29(1):10-24. learning[J].IEEE transactions on industrial informatics, [11]LIU Z,ZHOU J,CHEN C L P.Broad learning system: 2019(1):1-1. Feature extraction based on K-means clustering al- [25]贾晨，刘华平，续欣莹，等.基于宽度学习方法的多模态 gorithm[C]//2017 4th International Conference on Inform- 信息融合[).智能系统学报，2019,14(1)：154-161 ation,Cybernetics and Computational Social Systems. JIA Chen,LIU Huaping,XU Xinying,et al.Multi-modal London,UK,2017:683-687. information fusion based on broad learning method[J]

参考文献： BELL S, UPCHERCH P, SNAVELY N, et al. Material recognition in the wild with the materials in context database[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Massachusetts, Boston, 2015: 3479−3487. [1] 齐静, 徐坤, 丁希仑. 机器人视觉手势交互技术研究进展 [J]. 机器人, 2017, 39(4): 565–584. QI Jing, XU Kun, DING Xilun. Vision-based hand gesture recognition for human-robot interaction: a review[J]. Robot, 2017, 39(4): 565–584. [2] 吴钟强, 张耀文, 商琳. 基于语义特征的多视图情感分类方法 [J]. 智能系统学报, 2017, 12(5): 167–173. WU Zhongqiang, ZHANG Yaowen, SHANG Lin. Multiview sentiment classification of microblogs based on semantic features[J]. CAAI transactions on intelligent systems, 2017, 12(5): 167–173. [3] 温有福, 贾彩燕, 陈智能. 一种多模态融合的网络视频相关性度量方法 [J]. 智能系统学报, 2016, 11(3): 359–365. WEN Youfu, JIA Caiyan, CHEN Zhineng. A multi-modal fusion approach for measuring web video relatedness[J]. CAAI transactions on intelligent systems, 2016, 11(3): 359–365. [4] 马蕊, 刘华平, 孙富春, 等. 基于触觉序列的物体分类 [J]. 智能系统学报, 2015, 10(3): 362–368. MA Rui, LIU Huaping, SUN Fuchun, et al. Object classification based on the tactile sequence[J]. CAAI transactions on intelligent systems, 2015, 10(3): 362–368. [5] LIU H, WU Y, SUN F, et al. Weakly paired multimodal fusion for object recognition[J]. IEEE transactions on automation science and engineering, 2017, 15(2): 784–795. [6] EGUÍLUZ A G, RAÑÓ I, Coleman S A, et al. A multimodal approach to continuous material identification through tactile sensing[C]//2016 IEEE/RSJ International Conference on Intelligent Robots and Systems. Daejeon, Korea, 2016: 4912−4917. [7] ZHENG H, FANG L, JI M, et al. Deep learning for surface material classification using haptic and visual information[J]. IEEE transactions on multimedia, 2016, 18(12): 2407–2416. [8] ERICKSON Z, CHERNOVA S, KEMP C. Semi-supervised haptic material recognition for robots using generative adversarial networks[J]. arXiv: 1707.02796, 2017. [9] CHEN C L P, LIU Z. Broad learning system: an effective and efficient incremental learning system without the need for deep architecture[J]. IEEE transactions on neural networks and learning systems, 2017, 29(1): 10–24. [10] LIU Z, ZHOU J, CHEN C L P. Broad learning system: Feature extraction based on K-means clustering algorithm[C]//2017 4th International Conference on Information, Cybernetics and Computational Social Systems. London, UK, 2017: 683−687. [11] LIU Z, CHEN C L P. Broad learning system: Structural extensions on single-layer and multi-layer neural networks[C]//2017 International Conference on Security, Pattern Analysis, and Cybernetics. Shenzhen, China, 2017: 136−141. [12] JIN J, LIU Z, CHEN C L P. Discriminative graph regularized broad learning system for image recognition[J]. Science China information sciences, 2018, 61(11): 112209. [13] CHEN C L P, LIU Z, FENG S. Universal approximation capability of broad learning system and its structural variations[J]. IEEE transactions on neural networks and learning systems, 2018, 30(4): 1191–1204. [14] LI D, SHUJUAN J, CHUNJIN Z. Improved broad learning system: partial weights modification based on BP algorithm[J]. Materials science and engineering, 2018, 439(3): 032083. [15] ZHANG T L, CHEN R, YANG X, et al. Rich feature combination for cost-based broad learning system[J]. IEEE access, 2018, 7(1): 160–172. [16] ZHAO H, ZHENG J, DENG W, et al. Semi-supervised broad learning system based on manifold regularization and broad network[J]. IEEE transactions on circuits and systems I: regular papers, 2020, 67(3): 983–994. [17] KONG Y, WANG X, CHENG Y, et al. Hyperspectral imagery classification based on semi-supervised broad learning system[J]. Remote sensing, 2018, 10(5): 685. [18] FENG S, CHEN C L P. Fuzzy broad learning system: A novel neuro-fuzzy model for regression and classification[J]. IEEE transactions on cybernetics, 2018, 50(2): 414–424. [19] JIN J, CHEN C L P. Regularized robust broad learning system for uncertain data modeling[J]. Neurocomputing, 2018, 322(1): 58–69. [20] LIU Z, SHEN Y, LAKSHMINARASIMHAN V B, et al. Efficient low-rank multimodal fusion with modality-specific factors[J]. arXiv: 1806.00064, 2018. [21] 魏洁. 深度极限学习机的研究与应用 [D]. 太原: 太原理工大学, 2016. WEI Jie. Research and application of deep extreme learning machine[D]. Taiyuan: Taiyuan University of Technology, 2016. [22] ERICKSON Z, LUSKEY N, CHERNOVA S, et al. Classification of household materials via spectroscopy[J]. IEEE robotics and automation letters, 2019, 4(2): 700–707. [23] ZHENG W, LIU H, WANG B, et al. Cross-modal surface material retrieval using discriminant adversarial learning[J]. IEEE transactions on industrial informatics, 2019(1): 1–1. [24] 贾晨, 刘华平, 续欣莹, 等. 基于宽度学习方法的多模态信息融合 [J]. 智能系统学报, 2019, 14(1): 154–161. JIA Chen, LIU Huaping, XU Xinying, et al. Multi-modal information fusion based on broad learning method[J]. [25] 第 4 期王召新，等：基于级联宽度学习的多模态材质识别 ·793·

·794· 智能系统学报第15卷 CAAI transactions on intelligent systems,2019,14(1) 续欣莹，教授，主要研究方向为粒 154-161 计算、计算机视觉、智能控制。 [26]方静.基于LRF-ELM算法的研究及其在物体材质分类中的应用D].太原：太原理工大学，2018. FANG Jing.The research based on LRF-ELM algorithm and its application in the object material classification[D]. Taiyuan:Taiyuan University of Technology,2018. 孙富春，教授，博士生导师，中国作者简介：人工智能学会副理事长，主要研究方王召新，硕士研究生，主要研究方向为智能控制与机器人、多模态数据向为模式识别、计算机视觉，多模态感知、模式识别。IEEE Fellow,国家融合。 863计划专家组成员，荣获吴文俊科学技术奖创新奖一等奖、吴文俊科学技术奖进步奖一等奖。发表学术论文 200余篇，出版专著3部、译书1部出版专著3部，译书 1部。 2020中国智能技术与大数据会议中国智能技术与大数据会议是由中国人工智能学会智能服务专委会发起的系列会议，每年举办一次。第六届中国智能技术与大数据会议(CITBD:2020)将于2020年10月11日8：30-16：30在北京举行。10月 10日16：00-18：00举办中国人工智能学会智能服务专委会全体委员会议。本届会议将就智能技术与大数据相关的科学基础理论、关键技术方法与系统进行探讨和交流，旨在加强相关方向的基础理论研究，掌握最新和实用技术、了解前沿发展趋势，从而推动我国智能技术与大数据领域的学术繁荣及其在智能服务领域的应用推广。会议将邀请本领域知名专家做大会特邀报告，报告人将介绍智能服务与大数据相关技术的最新学术成果和发展趋势，并就其关键技术和主要战略发展方向进行深入地交流和研讨。会议期间还将召开中国人工智能学会智能服务专委会会议并发展新委员。诚挚欢迎全国各高等院校、科研院所和企事业单位的科技工作者参加本届会议。会议的主题包括但不限于以下方面：知识图谱过去、现在与未来、互联网认知搜索服务、科技大数据基础设施和服务技术、食品大数据技术与服务应用、司法大数据技术与应用等。主办单位中国人工智能学会承办单位中国人工智能学会智能服务专委会、北京工商大学、北京邮电大学会议地点：北京工商大学综合楼三层会议室地址：北京市海淀区阜成路33号北京工商大学西校区组委会联系方式：江老师：18519687573：张老师：15120072559。 E-mail:citbd2020@126.com

CAAI transactions on intelligent systems, 2019, 14(1): 154–161. 方静. 基于 LRF-ELM 算法的研究及其在物体材质分类中的应用 [D]. 太原: 太原理工大学, 2018. FANG Jing. The research based on LRF-ELM algorithm and its application in the object material classification[D]. Taiyuan: Taiyuan University of Technology, 2018. [26] 作者简介：王召新，硕士研究生，主要研究方向为模式识别、计算机视觉，多模态融合。续欣莹，教授，主要研究方向为粒计算、计算机视觉、智能控制。孙富春，教授，博士生导师，中国人工智能学会副理事长，主要研究方向为智能控制与机器人、多模态数据感知、模式识别。IEEE Fellow，国家 863 计划专家组成员，荣获吴文俊科学技术奖创新奖一等奖、吴文俊科学技术奖进步奖一等奖。发表学术论文 200 余篇，出版专著 3 部、译书 1 部出版专著 3 部，译书 1 部。 2020 中国智能技术与大数据会议中国智能技术与大数据会议是由中国人工智能学会智能服务专委会发起的系列会议，每年举办一次。第六届中国智能技术与大数据会议（CITBD2020）将于 2020 年 10 月 11 日 8:30-16:30 在北京举行。10 月 10 日 16:00-18:00 举办中国人工智能学会智能服务专委会全体委员会议。本届会议将就智能技术与大数据相关的科学基础理论、关键技术方法与系统进行探讨和交流，旨在加强相关方向的基础理论研究，掌握最新和实用技术、了解前沿发展趋势，从而推动我国智能技术与大数据领域的学术繁荣及其在智能服务领域的应用推广。会议将邀请本领域知名专家做大会特邀报告，报告人将介绍智能服务与大数据相关技术的最新学术成果和发展趋势，并就其关键技术和主要战略发展方向进行深入地交流和研讨。会议期间还将召开中国人工智能学会智能服务专委会会议并发展新委员。诚挚欢迎全国各高等院校、科研院所和企事业单位的科技工作者参加本届会议。会议的主题包括但不限于以下方面：知识图谱过去、现在与未来、互联网认知搜索服务、科技大数据基础设施和服务技术、食品大数据技术与服务应用、司法大数据技术与应用等。主办单位中国人工智能学会承办单位中国人工智能学会智能服务专委会、北京工商大学、北京邮电大学会议地点：北京工商大学综合楼三层会议室地址：北京市海淀区阜成路 33 号北京工商大学西校区组委会联系方式：江老师：18519687573；张老师：15120072559。 E-mail:citbd2020@126.com。 ·794· 智能系统学报第 15 卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录