正在加载图片...
·842· 智能系统学报 第17卷 至三类功能区属性作为划分依据,如图2所示。 果矩阵与外部特征模块的结果矩阵进行拼接。 最后用Tanh函数将融合后的输出映射到区间 [-l,l]中。在反向传播中,Tanh函数比标准逻辑 函数收敛得更快4。 商业区 2.1.2ST-SANet构架 图I展示了ST-SANet的架构,模型的主体为 上半部分的3个模块,分别对邻近性、周期性、趋势 性进行建模,每个模块由两个主要子模块组成,分 别是残差单元和分割注意力机制模块。整个城市 休闲区、文教区 范围内的数据量非常庞大,同时包含许多不同属 性的区域,使得抽象数据中隐藏了大量多元化的 特征信息,本文在残差网络算法(residual network, 图2城市功能区划分示意图 ResNet).的基础上引入了分割注意力机制,使模型 Fig.2 Schematic diagram of urban functional area division 具备了多模态数据特征提取的能力,进而深入地 将包含了城市功能区特征和时空流入流出量 发掘了更多维度数据信息。通过在ResNet结构 信息的数据,绘制成流入量流出量热力图22四,按 中堆叠分割注意力机制模块,形成了新的ResNet 照时间轴分成较近时间段、临近时间段以及遥远 变体ResNeSt2。它保留了整个ResNet结构,以 时间段3类,然后将3类数据输入到对应的模块 便直接用于下游任务,而不引入额外的计算成本。 中进行建模,从而提取前述的活动邻近性、周期 分割注意力机制模块中同一层的多个卷积核 性以及趋势性。3个模块共享相同的网络结构, 相互独立,可以各自提取特征,使得模型具有提 且彼此相互独立,都采用了卷积神经网络、残差 取多元化信息的特性。 单元序列、分割注意力机制模块结构。相较于原 残差模块输出为维度h=32、w=32、c=8的 始模型,改进后的结构能够更动态地提取影响程 矩阵X∈Tkxwxe,并作为分割注意力机制模块的输 度较大的数据特征,更准确地捕捉数据中的潜在 入,ResNeSt算法中的特征图组与ResNeXt算法Pa 关联性2。 相似,特征可以分为若干组,特征图组的数量由 为前3个主要模块的输出分配相应的权值 超参数K提供2,以此种方式将输入的特征分 后,融合为一个结果矩阵。然后将主要模块的结 成了若干基组(Cardinal组),如图3所示。 ResNeSt模块 (h,w,c) 输人 Cardinal组I Cardinal组k 。。。。。。。。。。。 Radix组I Radix组r Radix组I Radix组r 卷积1×1 卷积.1×1 卷积,1×1 卷积.1×1 clkir clkir clkir clkir 卷积,3×3 卷积.3×3 卷积3×3 卷积,3×3 clk clk clk h,w.c'lm) 分割注意力 分割注意力 (h,w.clm Concatenate函数 (h,,c) 卷积,1×1,c (h,w,c) 图3分割注意力机制模块 Fig.3 Model of split-attention至三类功能区属性作为划分依据,如图 2 所示。 商业区 休闲区、文教区 图 2 城市功能区划分示意图 Fig. 2 Schematic diagram of urban functional area division 将包含了城市功能区特征和时空流入流出量 信息的数据,绘制成流入量流出量热力图[21-22] ,按 照时间轴分成较近时间段、临近时间段以及遥远 时间段 3 类,然后将 3 类数据输入到对应的模块 中进行建模,从而提取前述的活动邻近性、周期 性以及趋势性。3 个模块共享相同的网络结构, 且彼此相互独立,都采用了卷积神经网络、残差 单元序列、分割注意力机制模块结构。相较于原 始模型,改进后的结构能够更动态地提取影响程 度较大的数据特征,更准确地捕捉数据中的潜在 关联性[23]。 为前 3 个主要模块的输出分配相应的权值 后,融合为一个结果矩阵。然后将主要模块的结 果矩阵与外部特征模块的结果矩阵进行拼接。 最后用 Tanh 函数将融合后的输出映射到区间 [−1,1] 中。在反向传播中,Tanh 函数比标准逻辑 函数收敛得更快[24]。 2.1.2 ST-SANet 构架 图 1 展示了 ST-SANet 的架构,模型的主体为 上半部分的 3 个模块,分别对邻近性、周期性、趋势 性进行建模,每个模块由两个主要子模块组成,分 别是残差单元和分割注意力机制模块。整个城市 范围内的数据量非常庞大,同时包含许多不同属 性的区域,使得抽象数据中隐藏了大量多元化的 特征信息,本文在残差网络算法(residual network, ResNet)的基础上引入了分割注意力机制,使模型 具备了多模态数据特征提取的能力,进而深入地 发掘了更多维度数据信息。通过在 ResNet 结构 中堆叠分割注意力机制模块,形成了新的 ResNet 变体 ResNeSt[25]。它保留了整个 ResNet 结构,以 便直接用于下游任务,而不引入额外的计算成本。 分割注意力机制模块中同一层的多个卷积核 相互独立,可以各自提取特征,使得模型具有提 取多元化信息的特性。 X ∈ T h×w×c 残差模块输出为维度 h = 32、w = 32、c = 8 的 矩阵 ,并作为分割注意力机制模块的输 入,ResNeSt 算法中的特征图组与 ResNeXt 算法[26] 相似,特征可以分为若干组,特征图组的数量由 超参数 K 提供[27-29] ,以此种方式将输入的特征分 成了若干基组(Cardinal 组),如图 3 所示。 ... Cardinal 组 1 ResNeSt 模块 (h, w, c) 输入 Concatenate 函数 卷积, 1×1, c 卷积, 3×3 c'/k Radix 组 1 卷积, 1×1 c'/k/r 卷积, 1×1 c'/k/r 卷积, 3×3 c'/k Radix 组 r (h, w, c'/m) (h, w, c'/m) (h, w, c') (h, w, c) 分割注意力 ... Cardinal 组 k 卷积, 3×3 c'/k Radix 组 1 卷积, 1×1 c'/k/r 卷积, 1×1 c'/k/r 卷积, 3×3 c'/k Radix 组 r 分割注意力 + 图 3 分割注意力机制模块 Fig. 3 Model of split-attention ·842· 智 能 系 统 学 报 第 17 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有