《工程科学学报》录用稿,htps:/doi.org/10.13374/i,issn2095-9389.2021.11.08.007©北京科技大学2020 基于树突神经网络的低轨卫星智能感知路由算法 刘洋”,王丽娜12区 1)北京科技大学计算机与通倍工程学院,北京1000832)北京科技大学顺德研究生院,佛山528300 ☒通倍作者,E-mail:win ustb(@126.com 摘要在低轨卫星网络中,卫星运行速度快、运行周期较短,星间链路动态变化,为及谢感星间链路状态并选择 正确的路由,提出一种基于树突神经网络的低轨卫星智能感知路由算法,通过卫星之间的可视性约束分析星间建链 情况,实现星间链路态势感知:通过实时构造训练集,利用树突神经网络自动调整全 卫星网络链路的权值,进而 优化传统Dijkstra算法,实现星间链路质量感知,给出智能路由决策:通过周期性监测卫星网络拓扑,实时修正初 始路由路径。仿真结果表明,基于树突神经网络的路由算法复杂度低,路径时延 时延抖动及丢包率均低于传统启 发式路由算法和Dijkstra路由算法。 终 关键词低轨卫星路由:智能感知:树突神经网络:机器学习: 分类号TN915 LEsatellit inteliet sensing based ona Dend network LIU Yang WANG Li-na2) 1) School of Computer and Communic Jniversity of Science and Technology Beijing,Beijing 100083,China 2 Shunde Graduate School,University o and Technology Beijing,Foshan 528300,China Corresponding author,E-mai win sth 126.com ABSTRACT In the low-orbit satellite network,the satellite operation speed is fast,the operation cycle is short,and the inter-satellite link changes dynamically.In order to sense the inter-satellite link state in time and select the correct route for intelligent routing depision,a Dendritic network based intelligent-aware routing algorithm for low-orbit satellites is proposed, which divides the inter-satellite link routing of the low-orbit satellite network into situation-aware,quality-aware and routing decision stages,and establishes a routing policy framework with real-time correction capability from source node to destination.This approach overcomes the problems that the existing deep learning-based routing algorithms can only select routing paths from fixed labels and the long convergence time of reinforcement learning-based routing algorithms. In the inter-satellite link situational awareness stage,the inter-satellite visibility of the entire low-orbit satellite network is periodically obtained by analyzing the constraint conditions of the inter-satellite link establishment.In the inter-satellite link quality perception stage,the probabilistic forwarding matrix finally output based on the ant colony algorithm is used as the label of the training set,and the corresponding inter-satellite link quality is evaluated by the probability value of the
基于树突神经网络的低轨卫星智能感知路由算法 刘 洋 1),王丽娜 1,2) 1) 北京科技大学计算机与通信工程学院,北京 100083 2) 北京科技大学顺德研究生院,佛山 528300 通信作者,E-mail: wln_ustb@126.com 摘 要 在低轨卫星网络中,卫星运行速度快、运行周期较短,星间链路动态变化,为及时感知星间链路状态并选择 正确的路由,提出一种基于树突神经网络的低轨卫星智能感知路由算法,通过卫星之间的可视性约束分析星间建链 情况,实现星间链路态势感知;通过实时构造训练集,利用树突神经网络自动调整全局卫星网络链路的权值,进而 优化传统 Dijkstra 算法,实现星间链路质量感知,给出智能路由决策;通过周期性监测卫星网络拓扑,实时修正初 始路由路径。仿真结果表明,基于树突神经网络的路由算法复杂度低,路径时延、时延抖动及丢包率均低于传统启 发式路由算法和 Dijkstra 路由算法。 关键词 低轨卫星路由;智能感知;树突神经网络;机器学习;星间链路 分类号 TN915 LEO satellite intelligent sensing routing algorithm based on a Dendrite network LIU Yang1) , WANG Li-na1,2) 1) School of Computer and Communication Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Shunde Graduate School, University of Science and Technology Beijing, Foshan 528300, China Corresponding author, E-mail: wln_ustb@126.com ABSTRACT In the low-orbit satellite network, the satellite operation speed is fast, the operation cycle is short, and the inter-satellite link changes dynamically. In order to sense the inter-satellite link state in time and select the correct route for intelligent routing decision, a Dendritic network based intelligent-aware routing algorithm for low-orbit satellites is proposed, which divides the inter-satellite link routing of the low-orbit satellite network into situation-aware, quality-aware and routing decision stages, and establishes a routing policy framework with real-time correction capability from source node to destination. This approach overcomes the problems that the existing deep learning-based routing algorithms can only select routing paths from fixed labels and the long convergence time of reinforcement learning-based routing algorithms. In the inter-satellite link situational awareness stage, the inter-satellite visibility of the entire low-orbit satellite network is periodically obtained by analyzing the constraint conditions of the inter-satellite link establishment. In the inter-satellite link quality perception stage, the probabilistic forwarding matrix finally output based on the ant colony algorithm is used as the label of the training set, and the corresponding inter-satellite link quality is evaluated by the probability value of the 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.11.08.007 ©北京科技大学 2020 录用稿件,非最终出版稿
current node selecting the next hop node.By changing the weight coefficients in the path cost function under different load states,more effective training set label data can be obtained to improve the performance of the trained Dendritic network,and 基金厦目:国家自然科学基金项目(61701020),北京科技大学顺德研究生院科技创新专项资金(BK19BF009) the training set can be optimized in real time through semi-supervised learning.The trained Dendritic network is used to analyze and process the link state parameters,perceive the comprehensive service quality of the link,and output the evaluation value matrix of the next hop routing.The Dendritic network is used to automatically adjust the weight of the global satellite network link,and then the traditional Dijkstra algorithm is optimized to realize the quality perception of the inter-satellite link.In the routing decision stage,the reciprocal of the evaluation value matrix is used as the adjacency matrix to pass the shortest path algorithm,and then the initial routing path between the source node and the destination node is obtained.Finally,the initial path is corrected by periodic monitoring to cope with the failure of the satellite node The simulation results show that the routing algorithm based on Dendritic network has low computational complexity and fast convergence,can sense the status of inter-satellite link establishment in time,and can make real-time assessment of the quality of inter-satellite link,and automatically avoid congested satellite nodes,so its end-to-end path delay,delay jitter and packet loss rate are lower than the traditional heuristic routing algorithm and Dijkstra routing algorithm. KEY WORDS LEO satellite routing:intelligent perception;Dendrite Network;Machine Learning:inter-satellite link 在6G愿景下,地面通信网络与卫星通信网络相互补充,构建跨地域、跨空域、跨海域的空- 天-海-地一体化网络,将实现真正意义上的全球无缝覆盖川。低轨星通信相较中、高轨卫星通信, 传输时延短、路径损耗小,多个卫星组成的星座可以实现真正的全球覆盖。因此,低轨卫星可在全 范围内提供快速且低延迟的互联网接入服务。星上路由技术是5G6G新基建下卫星通信的关键技术 之一,利用星间路由算法可以对卫星网络中数据的实时传输进行性能优化,保证数据的高效传输。 筋由算法与能量州技大牌食:可以提升路由的分花续策能力。因此,本文将针对低轨卫星网路 的智能感知路由算法进行研究。 由于卫星网路拓扑结构是动态变化的,根据应对括扑结构动态变化的方法可将卫星路由算法分 为两大类:静态虚拟拓扑的星间路由算法和动态星间路由算法。静态虚拟拓扑的星间路由算法基于 系统周期划分思想,将卫星网络结构由动态转化为静态,再在静态结构下设计协议进行路由。文 献[3]根据卫星的建链周期进行周期划分,进而在每个周期内进行时隙规划,研究了时分体制的指向 性星间链路网络的路由算法,分别以跳数和时延作为约束条件进行路由选择。文献「4]将整个系统周 期划分为固定长度的拓扑设计时间片,。基牙时延队列信息进行路由,提高了导航加权精度因子。文 献[5]借鉴了虚拟拓扑的思想,在此基础上提出了一种能量感知的路由方案,根据卫星的不同能级采 取不同措施保证数据传输,降低丢包率。上述这种将动态的卫星网络拓扑按一定的时间间隔划分为 静态的网络拓扑序列进行分桥处理的方法,由于事先建立路由表,卫星不需实时计算,协议开销较 小。但该种方式未考虑路由表,切换时的衔接问题向,并且由于路由表固定,难以应对卫星节点 故障、拥塞,以确保路由选择的服务质量(quality of service,QoS)。 动态星间路由算法很据实时链路状态信息进行计算,能够更好应对卫星网络拓扑变化和网络流 量变化。机器学习技术可以自动提取训练集中数据与标签之间的特征,对链路状态进行实时分析, 在动态路由优化方面相对于传统的启发式方法显示出巨大的优势。文献[8]提出适用于低轨卫星的机 器学习路由方法将各卫星节点的负载状态输入置信域策略梯度优化神经网络,实现负载均衡,但 该算法只考虑六种QoS指标。文献[9]提出一种基于机器学习的卫星网络路由机制,路由的起始 节点、目标节点各OoS度量等参数作为神经网络的输入,输出一条路径。由于其只能从训练集固 定标签中选取路径,若路径中某一节点出现故障,则会造成拥塞。文献[10]通过采用动态贪婪系数, 对传统Q-Learning强化学习算法进行改进,改善了容易陷入局部收敛的问题,但是该算法对于目 标节点奖励函数的设置并不明确。文献[11]提出了一种基于深度强化学习的软件定义路由优化方法, 基于实时链路状态,通过不断地输出下一跳路由构成整个数据传输的路径。深度强化学习算法能 够自适应动态变化的网络环境),但当卫星网络规模较大时,很难直接输出满足复杂约束的路径 14, 会导致算法收敛时间较长。 近年来,一些研究基于流量或者星间链路质量进行实时感知,做出路由决策。文献[15]通过感 知邻居节点的队列长度和能量进行路由决策,在降低卫星能耗的同时减轻网络的局部拥塞。但该研 究仿真部分只用树莓派搭建了6个节点,未能很好地模拟实际星间链路情况。文献[16]根据卫星之 间的链路状态信息确定水平和垂直传输的跳数和方向,对遇到故障节点的不同情况进行分析,但由
current node selecting the next hop node. By changing the weight coefficients in the path cost function under different load states, more effective training set label data can be obtained to improve the performance of the trained Dendritic network, and 基金项目:国家自然科学基金项目(61701020),北京科技大学顺德研究生院科技创新专项资金(BK19BF009) the training set can be optimized in real time through semi-supervised learning. The trained Dendritic network is used to analyze and process the link state parameters, perceive the comprehensive service quality of the link, and output the evaluation value matrix of the next hop routing. The Dendritic network is used to automatically adjust the weight of the global satellite network link, and then the traditional Dijkstra algorithm is optimized to realize the quality perception of the inter-satellite link. In the routing decision stage, the reciprocal of the evaluation value matrix is used as the adjacency matrix to pass the shortest path algorithm, and then the initial routing path between the source node and the destination node is obtained. Finally, the initial path is corrected by periodic monitoring to cope with the failure of the satellite node. The simulation results show that the routing algorithm based on Dendritic network has low computational complexity and fast convergence, can sense the status of inter-satellite link establishment in time, and can make real-time assessment of the quality of inter-satellite link, and automatically avoid congested satellite nodes, so its end-to-end path delay, delay jitter and packet loss rate are lower than the traditional heuristic routing algorithm and Dijkstra routing algorithm. KEY WORDS LEO satellite routing; intelligent perception; Dendrite Network; Machine Learning; inter-satellite link 在 6G 愿景下,地面通信网络与卫星通信网络相互补充,构建跨地域、跨空域、跨海域的空- 天-海-地一体化网络,将实现真正意义上的全球无缝覆盖[1]。低轨卫星通信相较中、高轨卫星通信, 传输时延短、路径损耗小,多个卫星组成的星座可以实现真正的全球覆盖。因此,低轨卫星可在全 球 范围内提供快速且低延迟的互联网接入服务。星上路由技术是 5G/6G 新基建下卫星通信的关键技术 之一,利用星间路由算法可以对卫星网络中数据的实时传输进行性能优化,保证数据的高效传输。 路由算法与智能感知技术融合,可以提升路由的分析和决策能力。因此,本文将针对低轨卫星网络 的智能感知路由算法进行研究。 由于卫星网路拓扑结构是动态变化的,根据应对拓扑结构动态变化的方法可将卫星路由算法分 为两大类:静态虚拟拓扑的星间路由算法和动态星间路由算法。静态虚拟拓扑的星间路由算法基于 系统周期划分思想,将卫星网络结构由动态转化为静态,再在静态结构下设计协议进行路由[2]。文 献[3]根据卫星的建链周期进行周期划分,进而在每个周期内进行时隙规划,研究了时分体制的指向 性星间链路网络的路由算法,分别以跳数和时延作为约束条件进行路由选择。文献[4]将整个系统周 期划分为固定长度的拓扑设计时间片,基于时延队列信息进行路由,提高了导航加权精度因子。文 献[5]借鉴了虚拟拓扑的思想,在此基础上提出了一种能量感知的路由方案,根据卫星的不同能级采 取不同措施保证数据传输,降低丢包率。上述这种将动态的卫星网络拓扑按一定的时间间隔划分为 静态的网络拓扑序列进行分析处理的方法,由于事先建立路由表,卫星不需实时计算,协议开销较 小。但该种方式未考虑路由表之间切换时的衔接问题[6],并且由于路由表固定,难以应对卫星节点 故障、拥塞,以确保路由选择的服务质量(quality of service, QoS)。 动态星间路由算法根据实时链路状态信息进行计算,能够更好应对卫星网络拓扑变化和网络流 量变化[7]。机器学习技术可以自动提取训练集中数据与标签之间的特征,对链路状态进行实时分析, 在动态路由优化方面相对于传统的启发式方法显示出巨大的优势。文献[8]提出适用于低轨卫星的机 器学习路由方法,将各卫星节点的负载状态输入置信域策略梯度优化神经网络,实现负载均衡,但 该算法只考虑了一种 QoS 指标。文献[9]提出一种基于机器学习的卫星网络路由机制,路由的起始 节点、目标节点、各 QoS 度量等参数作为神经网络的输入,输出一条路径。由于其只能从训练集固 定标签中选取路径,若路径中某一节点出现故障,则会造成拥塞。文献[10]通过采用动态贪婪系数, 对传统 Q-Learning 强化学习算法进行改进,改善了容易陷入局部收敛的问题,但是该算法对于目 标节点奖励函数的设置并不明确。文献[11]提出了一种基于深度强化学习的软件定义路由优化方法, 基于实时链路状态,通过不断地输出下一跳路由构成整个数据传输的路径[12]。深度强化学习算法能 够自适应动态变化的网络环境[13],但当卫星网络规模较大时,很难直接输出满足复杂约束的路径 [14],会导致算法收敛时间较长。 近年来,一些研究基于流量或者星间链路质量进行实时感知,做出路由决策。文献[15]通过感 知邻居节点的队列长度和能量进行路由决策,在降低卫星能耗的同时减轻网络的局部拥塞。但该研 究仿真部分只用树莓派搭建了 6 个节点,未能很好地模拟实际星间链路情况。文献[16]根据卫星之 间的链路状态信息确定水平和垂直传输的跳数和方向,对遇到故障节点的不同情况进行分析,但由 录用稿件,非最终出版稿
于只以最短路径为目标,会导致数据集中在同一条路径传输,容易造成拥塞。将智能感知与路由相 结合是未来重要研究方向,可以为路由选择提供保障。 针对静态卫星网络路由算法实时性差以及动态传统神经网络路由算法计算复杂度高等特点,为 了实时感知星间链路的多种QS因素,本文提出基于树突神经网络的低轨卫星智能感知路由算法。 该算法首先利用蚁群算法做出路由选择,收集输出结果,进而构造训练集,训练树突神经网络。在 星间链路态势感知阶段,对卫星之间的可视性约束进行分析,以此为前提得出当前时刻各个卫星之 间的建链状态:设置链路监测周期,周期性获取星间链路的建链情况,实现星间链路态势感知:在 神经网络链路质量感知阶段,将卫星节点之间的距离、时延、时延抖动、丢包率等链路状态信息作 为树突网络的输入参数,训练好的树突神经网络通过对链路状态信息进行处理,输出满足多种QoS 因素的下一跳路由选择的评估值矩阵:在路由决策阶段将评估值矩阵的倒数作为邻接矩阵通过 Dijkstra算法,得出源节点和目的节点之间的初始路径:最后周期性监测卫星网络拓扑,实时修正 初始路径。 1低轨卫网络模型 本文研究的低轨卫星网络采用Walker星座,Walker星座由高度和倾均相同的圆轨道卫星组 成,星座中所有卫星呈均匀对称分布,同一个轨道面内卫星分布均匀,不同轨道面间卫星的相位持 一定的相对关系m。Walker星座卫星轨道可以由三个参数N,P,F)表 V表示卫星总数、P表 示轨道而个数、F表示相位因子。Walker星座中编号为'的卫星其升交点赤经和升交点角距之间的 关系表示如下: W=(P-1)(P=1,2,, 4,=0(N,-1+°F-M21,2,,S-1) (1) 其中,S为每个轨道平面上的卫星数,B为卫星所在轨道平面的编号,N,为卫星在轨道平面内的 编号。本文所设置的低轨卫星网络基本星座构型为®r(64/81),轨道高度为800km,轨道倾 角为68.5°,星座轨道面的升交点赤经均分0~360°范围。通过Satellite Tool Kit软件仿真,得到该构 型的星座图以及其对应的星下点轨迹图分别如图1和图2所示。 风圆1STK中构建的星座图 圆2星下点轨迹图 Fig.1 Constellation diagram constructed in STK Fig.2 Under-satellite point trajectory diagram 2智能感知路由算法 星间链路状态变化频繁,无论是星间链路误码率过高导致的链路中断、星间相对运动导致的链 路中断与重连或是卫星节点的失效,均将使网络拓扑处于非稳定的状态。因此,星间路由算法应具 有动态感知卫星网络拓扑以及在变化拓扑下自适应重路由的能力。本文算法主要分为三个阶段: 星间链路态势感知阶段、星间链路质量感知阶段、路由决策阶段。基于树突神经网路的低轨卫星智 能感知路由算法流程图如图3所示
于只以最短路径为目标,会导致数据集中在同一条路径传输,容易造成拥塞。将智能感知与路由相 结合是未来重要研究方向,可以为路由选择提供保障。 针对静态卫星网络路由算法实时性差以及动态传统神经网络路由算法计算复杂度高等特点,为 了实时感知星间链路的多种 QoS 因素,本文提出基于树突神经网络的低轨卫星智能感知路由算法 。 该算法首先利用蚁群算法做出路由选择,收集输出结果,进而构造训练集,训练树突神经网络。在 星间链路态势感知阶段,对卫星之间的可视性约束进行分析,以此为前提得出当前时刻各个卫星之 间的建链状态;设置链路监测周期,周期性获取星间链路的建链情况,实现星间链路态势感知;在 神经网络链路质量感知阶段,将卫星节点之间的距离、时延、时延抖动、丢包率等链路状态信息作 为树突网络的输入参数,训练好的树突神经网络通过对链路状态信息进行处理,输出满足多种 QoS 因素的下一跳路由选择的评估值矩阵;在路由决策阶段将评估值矩阵的倒数作为邻接矩阵通过 Dijkstra 算法,得出源节点和目的节点之间的初始路径;最后周期性监测卫星网络拓扑,实时修正 初始路径。 1 低轨卫星网络模型 本文研究的低轨卫星网络采用 Walker 星座,Walker 星座由高度和倾角均相同的圆轨道卫星组 成,星座中所有卫星呈均匀对称分布,同一个轨道面内卫星分布均匀,不同轨道面间卫星的相位持 一定的相对关系[17]。Walker 星座卫星轨道可以由三个参数 N P F , , 表示: N 表示卫星总数、 P 表 示轨道而个数、 F 表示相位因子。Walker 星座中编号为i 的卫星其升交点赤经和升交点角距之间的 关系表示如下: 360 360 360 1 1,2, , 1 1 1,2, , 1 P i i i i i i s N W P P P u N F P N S (1) 其中, S 为每个轨道平面上的卫星数, Pi 为卫星所在轨道平面的编号, Ni 为卫星在轨道平面内的 编号。本文所设置的低轨卫星网络基本星座构型为 Walker(64/8/1),轨道高度为 800km,轨道倾 角为 68.5°,星座轨道面的升交点赤经均分 0~360°范围。通过 Satellite Tool Kit 软件仿真,得到该构 型的星座图以及其对应的星下点轨迹图分别如图 1 和图 2 所示。 图 1 STK 中构建的星座图 图 2 星下点轨迹图 Fig.1 Constellation diagram constructed in STK Fig.2 Under-satellite point trajectory diagram 2 智能感知路由算法 星间链路状态变化频繁,无论是星间链路误码率过高导致的链路中断、星间相对运动导致的链 路中断与重连或是卫星节点的失效,均将使网络拓扑处于非稳定的状态。因此,星间路由算法应具 有动态感知卫星网络拓扑以及在变化拓扑下自适应重路由的能力[18]。本文算法主要分为三个阶段: 星间链路态势感知阶段、星间链路质量感知阶段、路由决策阶段。基于树突神经网路的低轨卫星智 能感知路由算法流程图如图 3 所示。 录用稿件,非最终出版稿
Start Construct training set through ant colony algorithm Training model Obtain the satellite visual matrix at the current moment Input each link state matrix into the DD model No 终甜版稿 Dijkstra The initial path from the source node to the end node Whether to reach the destination node Whether the moni cycle is exceede No Forward by initial path 圆3算法流程图 Fig.3 Algorithm flowchart 2.1■闻链略态势感知阶段/ 在星间链路的态势感阶段,以卫星之间的可视性约束为前提并设置链路状态监测周期及时体 察链路状态,使得星间潞由能够对时变卫星网络的拓扑做出迅速调整。 2.1.1星间链路建链条伙) 卫星之间可视是星间建链的基础,接下来将对星间链路建立的条件进行分析。卫星之间能否建 链主要受以下俩个面的因素影响: )卫星询几何可视,即卫星之间的直线连线不受地球和大气层遮挡,是建立星间链路的前 提条件: 假设地球半径为R,,考虑到对流层和电离层等外界因素对信号的影响,设大气层厚度为,卫 星S的轨道高度为d,卫星S,的轨道高度为d,星间链路距离为。如图4为某时刻大气层与卫 星S和S的星间链路相切的情况,Pg为卫星S相对于S的俯仰角,P为卫星S相对于S的俯仰 角。此时为卫星之间几何可视的边界条件,因此建立星间链路的几何可视约束为: 04>-p84 (2) 其中,日4为卫星S相对于S的俯仰角,将式(2)转化为用距离表示: L(t)<(R+d-R2+(R+d)2-R2 (3)
Whether to reach the destination node Obtain the satellite visual matrix at the current moment Input each link state matrix into the DD model Dijkstra The initial path from the source node to the end node Yes End Start No Yes No Construct training set through ant colony algorithm Training model Whether the monition cycle is exceeded Forward by initial path 图 3 算法流程图 Fig.3 Algorithm flowchart 2.1 星间链路态势感知阶段 在星间链路的态势感知阶段,以卫星之间的可视性约束为前提并设置链路状态监测周期及时体 察链路状态,使得星间路由能够对时变卫星网络的拓扑做出迅速调整。 2.1.1 星间链路建链条件 卫星之间可视是星间建链的基础,接下来将对星间链路建立的条件进行分析。卫星之间能否建 链主要受以下两个方面的因素影响: a) 卫星之间几何可视,即卫星之间的直线连线不受地球和大气层遮挡,是建立星间链路的前 提条件; 假设地球半径为 Re ,考虑到对流层和电离层等外界因素对信号的影响,设大气层厚度为 h ,卫 星 Si 的轨道高度为 di ,卫星 S j 的轨道高度为 d j ,星间链路距离为 Lij 。如图 4 为某时刻大气层与卫 星 Si 和 S j 的星间链路相切的情况, ij 为卫星 Si 相对于 S j 的俯仰角, ij 为卫星 S j 相对于 Si 的俯仰 角。此时为卫星之间几何可视的边界条件,因此建立星间链路的几何可视约束为: A BA (2) 其中, A 为卫星 S j 相对于 Si 的俯仰角,将式(2)转化为用距离表示: 2 2 2 2 L t R d R R d R ij e i e e j e ( ) ( ) ( ) (3) 录用稿件,非最终出版稿
圆4某时刻卫星相对位置示意图 Fig.4 The image of the relative position of the satellite at a certain mo b)卫星之间天线可视,即两颗卫星均处于对方天线波束扫描范围内时才能完成信号的发送与接 收,是建立星间链路的根本条件。设卫星S:和S的波束扫描范围分别为 为满足天线可视 约束,84应满足如下条件: 8>y,-90 (4) 将式(4)转化为用距离表示: L>(d:+R)cos (d,+R)cosy (5) 综合分析卫星之间的几何可视和天线可视,得低会两颗卫星可以建立星间链路的充分必要条 件为 (d;+R)cosy;+(d;+R)cosy (0<V(R+d)2-R+VR+d)2-R (6) 2.1.2星间链路监测周期 若低轨卫星绕地运行周期为T, 单轨道内有N颗卫星,则TN即为LEO卫星网络的拓扑变化 周期T,。即最多经过T时间将有<颗卫星进入极地地区,进而卫星网络逻辑拓扑发生变化。本文 以T:为链路监测周期,超出链路监测凋期时应重新计算卫星节点之间的建链状态,对路由进行修正, 避免链路切换导致数据包的丢失。 2.2■闻随路质量感蜘阶食/ 在星间链路质量感知阶段需要对收集的卫星网络链路状态参数进行客观评估,以综合分析每条 链路的质量、提高Q6S。本文采用基于机器学习的评估方式,并以人工神经网络作为评估工具,计 算各个节点之间的链路代价,输出下一跳节点选择的评估值矩阵。 2.2.1路径代价及目标函数 端到端时延时延抖动、丢包率等均为影响卫星网络QoS的因素,卫星路由算法的设计应考虑 多种QoS因紫人避免网络拥塞。为提高QoS,本文提出的路由算法的路径代价综合考虑任意卫星节 点1与J之间的距离、时延、时延抖动、丢包率,公式如下: cost(i,j)=wD(i,j)+w2Delay(i,j)+wsJitter(i,j)+waLoss(i,j) (7) 式中c0s,》为链路的路径代价,路径代价反映了卫星节点之间传输链路质量的综合评价四。 D(i,、Delayi,.)、Jitter(i,)、Loss,小分别代表卫星节点i与J之间的距离、信息传输时延、 时延抖动、丢包率。":表示各Q0S因素所占的权重系数,系数之和为1,在本文中权重系数值将 随着负载状态的变化而改变。当某一Qo$指标变化较大时,其在路径代价函数中对应的权重系数将 比其他指标的权重系数大,这样在路径选择时可以避免选择该指标较大的星间链路。 在卫星网络拓扑中,phs,d)表示从源节点3到目的节点d所包含的路径,源节点到目标节点 之间的最优路径即为路径代价最小的路径,目标函数及约束条件如下:
图 4 某时刻卫星相对位置示意图 Fig.4 The image of the relative position of the satellite at a certain moment b) 卫星之间天线可视,即两颗卫星均处于对方天线波束扫描范围内时才能完成信号的发送与接 收,是建立星间链路的根本条件。设卫星 Si 和 S j 的波束扫描范围分别为 i 、 j ,为满足天线可视 约束, A 应满足如下条件: 90 i i (4) 将式(4)转化为用距离表示: L R d R ij i e i j e j (d )cos ( )cos (5) 综合分析卫星之间的几何可视和天线可视,得出任意两颗卫星可以建立星间链路的充分必要条 件为: 2 2 2 2 (d )cos ( )cos ( ) ( ) ( ) i e i j e j ij e i e e j e R d R L t R d R R d R (6) 2.1.2 星间链路监测周期 若低轨卫星绕地运行周期为T ,单轨道内有 N 颗卫星,则T N 即为 LEO 卫星网络的拓扑变化 周期Ts 。即最多经过Ts 时间将有一颗卫星进入极地地区,进而卫星网络逻辑拓扑发生变化[19]。本文 以Ts 为链路监测周期,超出链路监测周期时应重新计算卫星节点之间的建链状态,对路由进行修正, 避免链路切换导致数据包的丢失。 2.2 星间链路质量感知阶段 在星间链路质量感知阶段需要对收集的卫星网络链路状态参数进行客观评估,以综合分析每条 链路的质量、提高 QoS。本文采用基于机器学习的评估方式,并以人工神经网络作为评估工具,计 算各个节点之间的链路代价,输出下一跳节点选择的评估值矩阵。 2.2.1 路径代价及目标函数 端到端时延、时延抖动、丢包率等均为影响卫星网络 QoS 的因素,卫星路由算法的设计应考虑 多种 QoS 因素,避免网络拥塞。为提高 QoS,本文提出的路由算法的路径代价综合考虑任意卫星节 点i 与 j 之间的距离、时延、时延抖动、丢包率,公式如下: cos ( , ) , , , , t i j w D i j w Delay i j w Jitter i j w Loss i j 1 2 3 4 (7) 式中 cos ( , ) t i j 为链路 eij 的路径代价,路径代价反映了卫星节点之间传输链路质量的综合评价[20]。 D i j , 、 Delay i j , 、 Jitter i j , 、 Loss i j , 分别代表卫星节点i 与 j 之间的距离、信息传输时延、 时延抖动、丢包率。 wi 表示各 QoS 因素所占的权重系数,系数之和为 1,在本文中权重系数值将 随着负载状态的变化而改变。当某一 QoS 指标变化较大时,其在路径代价函数中对应的权重系数将 比其他指标的权重系数大,这样在路径选择时可以避免选择该指标较大的星间链路。 在卫星网络拓扑中, path s d ( , ) 表示从源节点s 到目的节点 d 所包含的路径,源节点到目标节点 之间的最优路径即为路径代价最小的路径,目标函数及约束条件如下: 录用稿件,非最终出版稿
min (cosi(s,d)=min cost(i,j) (s,d ∈path(s,d (8) s.tVey∈path(s,d), Delay(i,j)≤Delaymax Jitter(i,Jj≤Jitterma Loss(i,j)≤LOSSmax 其中,e,∈path(s,.d表示源节点至目标节点路径中的边,Delay、 Jittermax、 LOSSmax分别为实时 传输业务在LE0网络中所能承受的最大时延、时延抖动、丢包率。为了保证计算时各Q0S参数单 位的统一性,需对其进行以下归一化处理: Delay(i,)Delay-Delay(i.) Delaymax Jiter(i,)=Jter-Jiter(i. Jittermax L0ss(,j)'= Lossmax-Loss(,T LOSSma D(i,j)= Dmax-D(i,J八 D (9) 2.2.2基于蚁群算法构造训练集 传统基于深度学习的路由算法在构造训练集时,通常以经典路由算法获取的一条完整路径作为 训练集的标签。这样神经网络输出的结果只能从固定集合的路径中选取,若某一路径中的节点失效 则易产生拥塞。因此,本文基于蚁群算法最终输出的概率转发矩阵作为训练集的标签,通过当前节 点选择下一跳节点的概率值来评估对应的星间链路质量 蚁群算法是一种启发式算法,蚂蚁为网络中进行路由信息收集与更新的数据包,将蚁群算法中 的转发概率表对应为卫星网络的路由表2四,链路QS信息是蚂蚁选择下一跳节点的重要依据。神经 网络模型的训练依赖于训练数集,本文通过改变不同负载状态下路径代价函数中的权重系数,得出 更有效的训练集标签数据,以提高所训练的神经网络性能。构建训练集的具体过程如下: 首先,模拟不同负载情况下卫星节点之间的距离、时延、丢包率、时延抖动信息,并将这些状 态信息通过蚁群算法得出卫星节点选择下一跳节点的概率矩阵。进而将所得到不同负载状态下的概 率矩阵作为训练树突神经网络的标签,以此构建训练集,训练神经网络模型。当新的路由请求到达 时,输入神经网络,输出当前状态的评估值矩阵,将此结果作为新的标签加入训练集。这样通过 半监督学习的方式优化标签,动态构造训练集,更可以好感知卫星网络状态信息,继续训练优化模 型。 虽然通过蚁群算法以直接得出任意两点间的路径,但每次通过蚁群算法计算源节点到目标节 点的路径耗费时间过长,不利宇星上实时决策。而本文算法通过改进路径代价函数中的权重,利用 更有效的训练集,提前训练神经网络模型,提取出星间链路状态信息和星间链路质量评估值之间的 逻辑关系。进行路决策时,只需通过训练好的神经网络模型感知当前时刻的链路质量,基于感知 信息做出路由选择。虽然前期训练神经网络的过程较复杂,但是在路由选择时可快速做出决策。 22.3基于树突神经网络的星间链路质量评估 本文选用文献23]中刘刚博士等提出的树突网络(Dendrite Net,DD)算法,DD算法的良好性能 在文献[24]中得到验证。树突神经网络架构简单并且由于计算只包含矩阵乘法和哈达玛积,该算法 的计算复杂度远比传统神经网络中的非线性函数计算复杂度低。在每一代前向传播中,树突神经 网络都比传统人工神经网络速度快,有助于卫星网络实现低时延传输:路由算法所需的神经网络必 须具有非常强大的输出层,而DD算法可以有多个输出。综上,采用树突神经网络对卫星节点的 状态参数进行客观评估,以确保卫星路由满足多种QoS目标优化是可行的。DD是白盒算法,可以 将训练好的DD逻辑提取器转化为输入和输出关系谱。其中输入对应为卫星网络中各个节点的QoS 信息,输出的评估值矩阵即为当前节点选择其余节点作为下一跳的概率。 DD模块表示如下: A=W-1A-。X (10) 其中,A和4分别是模型的输入和输出,X代表树突神经网络的输入参数,W~是从第1-1到
( , ) ( , ) ( , ) min cos ( , ) min cos ( , ) ij path s d path s d e path s d t s d t i j (8) max max max . . ( , ), ( , ) Jitter( , ) Loss( , ) s t e path s d ij Delay i j Delay i j Jitter i j Loss 其中, e path s d ij , 表示源节点至目标节点路径中的边, Delaymax 、 Jittermax 、 Lossmax 分别为实时 传输业务在 LEO 网络中所能承受的最大时延、时延抖动、丢包率。为了保证计算时各 QoS 参数单 位的统一性,需对其进行以下归一化处理[21]: * max max * max max * max max max max ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , )= Delay Delay i j Delay i j Delay Jitter Jitter i j Jitter i j Jitter Loss Loss i j Loss i j Loss D D i j D i j D (9) 2.2.2 基于蚁群算法构造训练集 传统基于深度学习的路由算法在构造训练集时,通常以经典路由算法获取的一条完整路径作为 训练集的标签。这样神经网络输出的结果只能从固定集合的路径中选取,若某一路径中的节点失效 则易产生拥塞。因此,本文基于蚁群算法最终输出的概率转发矩阵作为训练集的标签,通过当前节 点选择下一跳节点的概率值来评估对应的星间链路质量。 蚁群算法是一种启发式算法,蚂蚁为网络中进行路由信息收集与更新的数据包,将蚁群算法中 的转发概率表对应为卫星网络的路由表[22],链路 QoS 信息是蚂蚁选择下一跳节点的重要依据。神经 网络模型的训练依赖于训练数集,本文通过改变不同负载状态下路径代价函数中的权重系数,得出 更有效的训练集标签数据,以提高所训练的神经网络性能。构建训练集的具体过程如下: 首先,模拟不同负载情况下卫星节点之间的距离、时延、丢包率、时延抖动信息,并将这些状 态信息通过蚁群算法得出卫星节点选择下一跳节点的概率矩阵。进而将所得到不同负载状态下的概 率矩阵作为训练树突神经网络的标签,以此构建训练集,训练神经网络模型。当新的路由请求到达 时,输入神经网络,输出当前状态下的评估值矩阵,将此结果作为新的标签加入训练集。这样通过 半监督学习的方式优化标签,动态构造训练集,更可以好感知卫星网络状态信息,继续训练优化模 型。 虽然通过蚁群算法可以直接得出任意两点间的路径,但每次通过蚁群算法计算源节点到目标节 点的路径耗费时间过长,不利于星上实时决策。而本文算法通过改进路径代价函数中的权重,利用 更有效的训练集,提前训练神经网络模型,提取出星间链路状态信息和星间链路质量评估值之间的 逻辑关系。进行路由决策时,只需通过训练好的神经网络模型感知当前时刻的链路质量,基于感知 信息做出路由选择。虽然前期训练神经网络的过程较复杂,但是在路由选择时可快速做出决策。 2.2.3 基于树突神经网络的星间链路质量评估 本文选用文献[23]中刘刚博士等提出的树突网络(Dendrite Net,DD)算法,DD 算法的良好性能 在文献[24]中得到验证。树突神经网络架构简单并且由于计算只包含矩阵乘法和哈达玛积,该算法 的计算复杂度远比传统神经网络中的非线性函数计算复杂度低[25]。在每一代前向传播中,树突神经 网络都比传统人工神经网络速度快,有助于卫星网络实现低时延传输;路由算法所需的神经网络必 须具有非常强大的输出层[26],而 DD 算法可以有多个输出。综上,采用树突神经网络对卫星节点的 状态参数进行客观评估,以确保卫星路由满足多种 QoS 目标优化是可行的。DD 是白盒算法,可以 将训练好的 DD 逻辑提取器转化为输入和输出关系谱。其中输入对应为卫星网络中各个节点的 QoS 信息,输出的评估值矩阵即为当前节点选择其余节点作为下一跳的概率。 DD 模块表示如下: l l l l , 1 1 A W A X (10) 其中, l 1 A 和 l A 分别是模型的输入和输出, X 代表树突神经网络的输入参数, l l, 1 W 是从第l 1到 录用稿件,非最终出版稿
第!个模型的权重矩阵,“。”代表哈达玛乘积,图5为本文所需DD算法模型。 1 WiOXoX WA.X W32A2 圆5DD算法模型 Fig.5 DD algorithm model 2.2.4DD学习规则 DD模块和线性模块的前向传播: A=W--1。X AL =WLL-AL-I (11) DD模块和线性模块的误差反向传播规则: dA!=Y- dZ=dA dZ=dA。 d4-=W- 版稿 (12) (13) (14) DD通过梯度下降进行权重调整: dwud4-) (15) W!.-new Luri-1old (16) 将经过归一化处理后卫星之间的距离矩阵 欣延矩件X,、时延抖动矩阵X、丢包率矩阵 X;作为输入参数输入树突神经网络,树突神经两络内部算法表达式如下: 9=w w2wiox)ox)ox) W 形0 weX。 x。 Xo X =[g2W2 W 形0 W w w分 w W Y, X Y, W X」 x (17) 公式(17)是通过哈达玛乘积建立当前输入和先前输入的逻辑关系, 式中W°是从第0到第1 个模型的权重矩阵,W”足众毅到第2个模型的权重矩阵,W2是从第2到第3个模型的权重矩阵, 其中初始化权重矩阵服从均匀分布。树突神经网络每一层的权重W将利用训练集的标签Y,,通 过式(12)-(16)被不断训练调整,直至训练出误差较小、与目标函数拟合程度较高的树突神经网络。 树突神经网络经过与训练集的拟合,训练好的神经网络逻辑提取器将转化为关于链路状态参数 输入和选择下大跳路由节点概率输出的关系谱。所输出的矩阵Y是基于概率的路由,将其定义为评 估值矩阵,星与卫星J的链路所对应评估值为,则评估值矩阵表达式如下: [0 1,2·1,24 i= ,10 …y2,24 L24,1y24.2· 0 (18) 其中输出的节点对应评估值越大,选择该节点作为下一跳的概率越大:当两节点间不满足可视性约 束时,对应评估值为0:当最佳路径中某一节点出现故障时,可选择评估值相对较高的其他卫星节 点,避免链路拥塞。该评估值矩阵综合考虑多种QoS因素,并且不像启发式算法过于依赖人类经验, 而是通过人工神经网络不断优化训练得到的客观评估结果。 2.3略由决策阶段 Dijkstra算法是常见的最短路径算法,在路由决策阶段将评估值矩阵取倒数作为Dijkstra算法的
第l 个模型的权重矩阵,“ ”代表哈达玛乘积,图 5 为本文所需 DD 算法模型。 32 2 W A 2 A 1 A 10 W X X 21 1 W A X 图 5 DD 算法模型 Fig.5 DD algorithm model 2.2.4 DD 学习规则 DD 模块和线性模块的前向传播: , 1 1 , 1 1 l l l l L L L L A W A X A W A (11) DD 模块和线性模块的误差反向传播规则: ˆ dAL Y Y (12) l dZ =dA L L l dZ dA X (13) 1 , 1 T l l l l dA W dZ (14) DD 通过梯度下降进行权重调整: , 1 1 1 T l l l l m dW dZ A (15) l l new l l old , 1 , 1 l l, 1 W W dW (16) 将经过归一化处理后卫星之间的距离矩阵 X0 、时延矩阵 X1、时延抖动矩阵 X2 、丢包率矩阵 X3 作为输入参数输入树突神经网络,树突神经网络内部算法表达式如下: 32 21 10 21 21 21 21 10 10 10 10 11 12 13 14 11 12 13 14 21 21 21 21 10 10 10 10 32 32 32 32 21 22 23 24 21 22 23 24 11 12 13 14 21 21 21 21 10 10 10 10 31 32 33 34 31 32 33 34 21 21 21 21 1 41 42 43 44 41 Y W W W X X X ˆ W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W 0 0 0 1 1 1 2 2 2 0 10 10 10 42 43 44 3 3 3 X X X X X X X X X W W W X X X (17) 公式(17)是通过哈达玛乘积建立当前输入和先前输入的逻辑关系,式中 10 W 是从第 0 到第 1 个模型的权重矩阵, 21 W 是从第 1 到第 2 个模型的权重矩阵, 32 W 是从第 2 到第 3 个模型的权重矩阵, 其中初始化权重矩阵服从 0-1 均匀分布。树突神经网络每一层的权重W 将利用训练集的标签Y ,通 过式(12)-(16)被不断训练调整,直至训练出误差较小、与目标函数拟合程度较高的树突神经网络。 树突神经网络经过与训练集的拟合,训练好的神经网络逻辑提取器将转化为关于链路状态参数 输入和选择下一跳路由节点概率输出的关系谱。所输出的矩阵Yˆ 是基于概率的路由,将其定义为评 估值矩阵,其中卫星i 与卫星 j 的链路所对应评估值为 yi j , ,则评估值矩阵表达式如下: 1,2 1,24 2,1 2,24 24,1 24,2 0 0 ˆ y 0 y y y y Y y (18) 其中输出的节点对应评估值越大,选择该节点作为下一跳的概率越大;当两节点间不满足可视性约 束时,对应评估值为 0;当最佳路径中某一节点出现故障时,可选择评估值相对较高的其他卫星节 点,避免链路拥塞。该评估值矩阵综合考虑多种 QoS 因素,并且不像启发式算法过于依赖人类经验, 而是通过人工神经网络不断优化训练得到的客观评估结果。 2.3 路由决策阶段 Dijkstra 算法是常见的最短路径算法,在路由决策阶段将评估值矩阵取倒数作为 Dijkstra 算法的 录用稿件,非最终出版稿
输入邻接矩阵,可输出一条满足目标函数、链路代价最小、具有Q0S保障的最佳初始路径。一方面, 在监测周期内按初始路径进行路由,若超出监测周期则需重新计算初始路径中当前节点与其对应下 一跳节点之间的建链状态:若不可建链,需获取当前时刻的节点状态信息并输入树突神经网络,重 新进行路由选择,对初始路径进行修正,实现卫星路由的实时感知。另一方面,当初始路径中某一 节点的下一跳节点出现故障时,可选择当前节点的次佳下一跳节点,再通过Dijkstra算法得出路径。 3算法性能评估 3.1仿真环镜配量 本文首先利用Satellite Tool Kit(STK)软件创建一个新的场景,场景时间设为2Dec2020 04:00:00.000至2Dec202005:00:00.000。先生成seed卫星,再通过walker方法快速创建walker星 座,walker的参数设置如表l。 表1 waIker数设量 Table 1 The parameter setting of the Walker constellation parameter name Type Number of Sats per Plane Number of Planes Inter Plane Spacing RAAN Spread 360 deg 取其中24颗低轨卫星,利用STK对卫星之间的可视性约束进行分析,可得出卫星之间在任意 时刻的建链情况,导出卫星之间的可视性矩阵。低轨星绕地运行周期约85mi,单轨道内有8颗 卫星,因此监测周期为l0min。每隔l0min将对所得路径涉及卫星节点之间的可视情况进行确定, 避免整个卫星网络拓扑状态发生变化时,有链路断开未能及时发现。 之后,通过MATLAB和STK的互联接将©p6ort中链路可视矩阵信息以及卫星之间的距离矩 阵传给MATLAB:利用MATLAB对卫星之间的信道进行建模,同时生成卫星之间的多普勒频移, 进而模拟卫星之间的带宽、时延、时延抖动、丢包率矩阵。链路参数设置如表2所示。 表2能路必设量 Table 2 The parameter setting of the link Parameter name Parameter value Delay 100 Loss 0.0005 3.6×104 在初始时刻, 路径代价函数中各权重系数值均为0.25。当前网络中数据包传输完成后,统计平 均端到端时延、丢包率时延抖动,分别计算当前负载状态与前一负载状态相比三种Qo$指标增加 的百分比。假设平均端到端时延、丢包率、时延抖动分别增加了a、b、c,则下一负载状态下路径代 价函数中权重系数分别为: 0.25 1%=0.25+a+b+e,W2=0.25+a+b+c,1%=0.25+a+b+c,W4=0.25+a+b+c (19)
输入邻接矩阵,可输出一条满足目标函数、链路代价最小、具有 QoS 保障的最佳初始路径。一方面, 在监测周期内按初始路径进行路由,若超出监测周期则需重新计算初始路径中当前节点与其对应下 一跳节点之间的建链状态;若不可建链,需获取当前时刻的节点状态信息并输入树突神经网络,重 新进行路由选择,对初始路径进行修正,实现卫星路由的实时感知。另一方面,当初始路径中某一 节点的下一跳节点出现故障时,可选择当前节点的次佳下一跳节点,再通过 Dijkstra 算法得出路径。 3 算法性能评估 3.1 仿真环境配置 本文首先利用 Satellite Tool Kit(STK)软件创建一个新的场景,场景时间设为 2 Dec 2020 04:00:00.000 至 2 Dec 2020 05:00:00.000。先生成 seed 卫星,再通过 walker 方法快速创建 walker 星 座,walker 的参数设置如表 1。 表 1 walker 参数设置 Table 1 The parameter setting of the Walker constellation parameter name Parameter value Type Delta Number of Sats per Plane 8 Number of Planes 8 Inter Plane Spacing 1 RAAN Spread 360 deg 取其中 24 颗低轨卫星,利用 STK 对卫星之间的可视性约束进行分析,可得出卫星之间在任意 时刻的建链情况,导出卫星之间的可视性矩阵。低轨卫星绕地运行周期约 85min,单轨道内有 8 颗 卫星,因此监测周期为 10min。每隔 10min 将对所得路径涉及卫星节点之间的可视情况进行确定, 避免整个卫星网络拓扑状态发生变化时,有链路断开未能及时发现。 之后,通过 MATLAB 和 STK 的互联接口将 report 中链路可视矩阵信息以及卫星之间的距离矩 阵传给 MATLAB;利用 MATLAB 对卫星之间的信道进行建模,同时生成卫星之间的多普勒频移, 进而模拟卫星之间的带宽、时延、时延抖动、丢包率矩阵。链路参数设置如表 2 所示。 表 2 链路参数设置 Table 2 The parameter setting of the link Parameter name Parameter value Delaymax / ms 100 Lossmax 0.0005 Jittermax -4 3. 6 10 在初始时刻,路径代价函数中各权重系数值均为 0.25。当前网络中数据包传输完成后,统计平 均端到端时延、丢包率、时延抖动,分别计算当前负载状态与前一负载状态相比三种 QoS 指标增加 的百分比。假设平均端到端时延、丢包率、时延抖动分别增加了 a、b、c,则下一负载状态下路径代 价函数中权重系数分别为: 0.25 1 2 3 4 0.25 0.25 0.25 0.25 a b c w w w w a b c a b c a b c a b c , , , 录用稿件,非最终出版稿 (19)
3.2仿真结果分析 0.20 0.150 0075 0a50 0.025 4 Satellite node ■6树突神经网络拟合图 圆7选择下一跳卫星节点的概率 Fig.6 Dendritic network fitting graph Fig.7 Probability of selecting the next hop satellite node 图6为通过MATLAB软件仿真得到的树突神经网络拟合图,由此以发现当训练3×I0代之 后误差曲线趋于稳定,并且误差很小,可以以高概率收敛到全局最优风表明本文所选用的树突神经 网络拟合性能较好。图7当输入是第1个卫星节点至其他23个各卫星节点的状态信息时,输出第 一个卫星节点选择其他卫星节点作为下一跳的概率。 当概率为0时,表明两个卫星节点之间不满足 可视性约束,不能建立星间链路。 为了验证树突神经网络路由算法的性能,分别与蚁群算法(Ant Colony Algorithm,.ACA)和 Dijkstra算法进行仿真对比。在网络负载量较低时,李种算法仿真得出源节点1至目的节点3的路 径分别为蚁群:1-20-3,Dijkstra:1-2-3,树突神经网络算法:1-2-3:节点12至节点15的路径分别 为蚁群:12-23-14-8-15,Dijkstra:12-13-8-15,树突神经网络算法:12-13-8-15:随着网络负载量增 加,源节点1至目的节点3的路径分别为蚁群219-3,Dijkstra:1-2-3,树突神经网络算法:1- 19-3:图8为给定相同源节点和目的节点的条侏下三种算法的平均跳数和最大跳数对比图。由于 蚁群算法属于启发式算法,其容易陷入局部最优解、收敛性较差,有时需较多跳数才可到达: Dijkstra算法在进行路由选择时直接考虑最短距离路径,并不考虑所选链路的拥塞情况,因此其只 需较少的跳数即可达到目的节点:本文算法在综合考虑多种Q0S因素的情况下,可以避开拥塞节点。 在实际工程中,卫星路由的跳数应尽可能小。本文所提路由算法的平均跳数与Dijkstra算法一致, 这表明其在避开拥塞节点时并未以牺性路由跳数为代价。接下来将对三种路由算法在时延、丢包率、 时延抖动方面的性能进行比较。 圈8相同源节点至;点的路由跳数对比 圆9端到端平均时延对比 Fig.8 Comparison of route hops Fig.9 End-to-end average delay comparison DD DD 0 1.7 --ACA ACA 62 TuaBFPTNRInos 510 20 40上 Number of data packets generaed DD Number of data packets generated ■10端到端平均丢包率对比 圆11端到端平均时延抖动对比 Fig.10 End-to-end average packet loss rate comparison Fig.11 End-to-end average delay jitter comparison
3.2 仿真结果分析 图 6 树突神经网络拟合图 图 7 选择下一跳卫星节点的概率 Fig.6 Dendritic network fitting graph Fig.7 Probability of selecting the next hop satellite node 图 6 为通过 MATLAB 软件仿真得到的树突神经网络拟合图,由此可以发现当训练 5 3 10 代之 后误差曲线趋于稳定,并且误差很小,可以以高概率收敛到全局最优,表明本文所选用的树突神经 网络拟合性能较好。图 7 当输入是第 1 个卫星节点至其他 23 个各卫星节点的状态信息时,输出第 一个卫星节点选择其他卫星节点作为下一跳的概率。当概率为 0 时,表明两个卫星节点之间不满足 可视性约束,不能建立星间链路。 为了验证树突神经网络路由算法的性能,分别与蚁群算法 (Ant Colony Algorithm, ACA)和 Dijkstra 算法进行仿真对比。在网络负载量较低时,三种算法仿真得出源节点 1 至目的节点 3 的路 径分别为蚁群:1-20-3,Dijkstra:1-2-3,树突神经网络算法:1-2-3;节点 12 至节点 15 的路径分别 为蚁群:12-23-14-8-15,Dijkstra:12-13-8-15,树突神经网络算法:12-13-8-15;随着网络负载量增 加,源节点 1 至目的节点 3 的路径分别为蚁群:1-2-19-3,Dijkstra:1-2-3,树突神经网络算法:1- 19-3;图 8 为给定相同源节点和目的节点的条件下,三种算法的平均跳数和最大跳数对比图。由于 蚁群算法属于启发式算法,其容易陷入局部最优解、收敛性较差,有时需较多跳数才可到达; Dijkstra 算法在进行路由选择时直接考虑最短距离路径,并不考虑所选链路的拥塞情况,因此其只 需较少的跳数即可达到目的节点;本文算法在综合考虑多种 QoS 因素的情况下,可以避开拥塞节点。 在实际工程中,卫星路由的跳数应尽可能小。本文所提路由算法的平均跳数与 Dijkstra 算法一致, 这表明其在避开拥塞节点时并未以牺牲路由跳数为代价。接下来将对三种路由算法在时延、丢包率 、 时延抖动方面的性能进行比较。 图 8 相同源节点至目节点的路由跳数对比 图 9 端到端平均时延对比 Fig.8 Comparison of route hops Fig.9 End-to-end average delay comparison 图 10 端到端平均丢包率对比 图 11 端到端平均时延抖动对比 Fig.10 End-to-end average packet loss rate comparison Fig.11 End-to-end average delay jitter comparison 0 1 2 3 4 5 6 7 8 9 10 Epochs 10 5 -3 -2.5 -2 -1.5 -1 -0.5 0 Error 0 10 20 30 40 50 60 0 2 4 6 8 10 12 14 16 Delay / ms Number of data packets generated DD ACA Dijkstra 3 3 3 5 5 6 DD Dijkstra ACA 0 1 2 3 4 5 6 7 8 Source-to-end hop count Average Max 0 10 20 30 40 50 60 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Delay jitter Number of data packets generated DD ACA Dijkstra 0 10 20 30 40 50 60 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 Packet loss rate / % Number of data packets generated DD ACA Dijkstra 录用稿件,非最终出版稿
由图9至图11所示,随着数据包产生个数的加大,由于网络负载量不断增加,三种算法的瑞 到端时延、丢包率以及时延抖动均成上升趋势。在数据包产生个数小于20时,由于卫星网路负载 量较低,三种路由算法的时延、丢包率、时延抖动均较低。随着数据包产生个数的增多,本文算法 的性能优势逐渐明显,其时延、丢包率、时延抖动均比Dijkstra算法以及蚁群算法低。这是因为 Dijkstra算法直接选取最短距离路径进行路由,并不考虑链路质量,随着时间推移,最短路径上极 易出现拥塞,导致时延、丢包率、时延抖动大幅度增加,而其他路径带宽利用率低、浪费资源:蚁 群算法虽考虑多种QoS因素,性能与Dijkstra算法相比较好,但其收敛性较差。本文所提算法性能 的提升主要有以下原因:其一,本文算法通过改变路径代价函数在不同负载状态下的权重系数来训 练树突神经网络,可以避免选择QoS指标不好的链路;比如当网络中平均时延增长较多时,由于时 延权重与其他指标的权重相比较大,接下来进行路由选择时,在综合考虑多种QoS指标的情况下 会避免选择时延较大的路径:其二,通过半监督学习的方式动态构造训练集可以优化树突神经网络 模型,利用树突神经网络自动调整全局卫星网络链路的评估值,更好地感知网络的状态信息,辅助 做出智能路由决策。最终,当某一节点数据量较多时,可通过感知的链路权重信息自适应调节,避 免选择易拥塞节点,从而降低整个卫星网络的平均时延、丢包率和时延抖动。 四结 本文提出一种基于树突神经网络的低轨卫星智能感知路由算法,星间链路态势感知阶段,周期 性分析星间可视性情况:采用树突神经网络对链路状态参数进行分析处锂黔感知链路的综合服务质 量,输出下一跳路由选择的评估值矩阵:在路由决策阶段将评估值矩阵倒数作为邻接矩阵通过最短 路径算法,进而得出源节点和目的节点之间的初始路由路径:最后通过周期性监测修正初始路径以 应对卫星节点失效。仿真结果表明:在相同数据包到达的情况爪,该路由算法和传统路由算法相比 性能更加优越。 参考文献 [1]Peng J,Sun M Y,Teng X Q.6G Vision and Application China Industry Information Technology, 2020,(09):18 (彭健,孙美玉,滕学强.6G愿景及应用场景展望、币国工业和信息化,2020,(09):18) [2]Liu X,Xie J S,Chen S W.Low-orbit satellite network routing mechanism based on link state awareness.Astronautical Systems Engineering Technology,2020,4(02):33 (刘询,谢金森.陈双武.链路状态感知的低轨卫星网络路由机制.宇航总体技术,2020,4(02):33) 3]Shao F W.Research on the Link Route Technology of the Inter-satellite Link Network of the Satellite Navigation System [Dissertation].Beijing:University of Chinese Academy of Sciences,2017 (邵丰伟.卫星导航系统星间链路闷络建链路由技术研究[学位论文].北京:中国科学院大学,2017) [4]Huang J H.Research on Optimdl Design Technology of Inter-satellite Link Network in Satellite Navigation System [Dissertation].Changsha:National University of Defense Technology,2018 (黄今辉.卫星导航紊统星间链路网络优化设计技术研究[学位论文].长沙:国防科技大学,2018) [5]L.Hao,P.Ren,Q.Du Satellite QoS Routing Algorithm Based on Energy Aware and Load Balancing /International Conference on Wireless Communications and Signal Processing.Nanjing,2020:685 [6 Gao H,Wang L Hang W D.et al.Route optimization method for fast retum of overseas satellite data of BeiDou global satellitenavigation system.Chinese Space Science and Technology,2018,38(3):9 (高贺,王玲,黄文德,等.北斗全球卫星导航系统境外星数据快速回传的路由优化方法.中国空间科学技术, 2018.38(3):9) [7]Liao G Y.Research on routing algorithm of low-orbit satellite network based on inter-satellite link [Dissertation]. Chongqing:Chongqing University of Posts and Telecommunications,2020 (廖光燕.基于星间链路的低轨卫星网络路由算法研究学位论文1.重庆:重庆邮电大学,2020) [8]Li X T,Zhang Y S.A SDN network artificial intelligence routing method suitable for low-orbit satellites.Electronic Measurement Technology,2020,43(22):109 (李新桐,张亚生.一种适用于低轨卫星的SDN网络人工智能路由方法.电子测量技术,2020,43(22):109)
由图 9 至图 11 所示,随着数据包产生个数的加大,由于网络负载量不断增加,三种算法的端 到端时延、丢包率以及时延抖动均成上升趋势。在数据包产生个数小于 20 时,由于卫星网路负载 量较低,三种路由算法的时延、丢包率、时延抖动均较低。随着数据包产生个数的增多,本文算法 的性能优势逐渐明显,其时延、丢包率、时延抖动均比 Dijkstra 算法以及蚁群算法低。这是因为 Dijkstra 算法直接选取最短距离路径进行路由,并不考虑链路质量,随着时间推移,最短路径上极 易出现拥塞,导致时延、丢包率、时延抖动大幅度增加,而其他路径带宽利用率低、浪费资源;蚁 群算法虽考虑多种 QoS 因素,性能与 Dijkstra 算法相比较好,但其收敛性较差。本文所提算法性能 的提升主要有以下原因:其一,本文算法通过改变路径代价函数在不同负载状态下的权重系数来训 练树突神经网络,可以避免选择 QoS 指标不好的链路;比如当网络中平均时延增长较多时,由于时 延权重与其他指标的权重相比较大,接下来进行路由选择时,在综合考虑多种 QoS 指标的情况下 会避免选择时延较大的路径;其二,通过半监督学习的方式动态构造训练集可以优化树突神经网络 模型,利用树突神经网络自动调整全局卫星网络链路的评估值,更好地感知网络的状态信息,辅助 做出智能路由决策。最终,当某一节点数据量较多时,可通过感知的链路权重信息自适应调节 ,避 免选择易拥塞节点,从而降低整个卫星网络的平均时延、丢包率和时延抖动。 四 结论 本文提出一种基于树突神经网络的低轨卫星智能感知路由算法,星间链路态势感知阶段,周期 性分析星间可视性情况;采用树突神经网络对链路状态参数进行分析处理,感知链路的综合服务质 量,输出下一跳路由选择的评估值矩阵;在路由决策阶段将评估值矩阵倒数作为邻接矩阵通过最短 路径算法,进而得出源节点和目的节点之间的初始路由路径;最后通过周期性监测修正初始路径以 应对卫星节点失效。仿真结果表明:在相同数据包到达的情况下,该路由算法和传统路由算法相比 性能更加优越。 参 考 文 献 [1] Peng J, Sun M Y, Teng X Q. 6G Vision and Application Scenario Outlook. China Industry & Information Technology, 2020, (09): 18 (彭健, 孙美玉, 滕学强. 6G 愿景及应用场景展望. 中国工业和信息化, 2020, (09): 18) [2] Liu X, Xie J S, Chen S W. Low-orbit satellite network routing mechanism based on link state awareness. Astronautical Systems Engineering Technology, 2020, 4 (02): 33 (刘洵, 谢金森, 陈双武. 链路状态感知的低轨卫星网络路由机制. 宇航总体技术, 2020, 4 (02): 33) [3] Shao F W. Research on the Link Route Technology of the Inter-satellite Link Network of the Satellite Navigation System [Dissertation]. Beijing: University of Chinese Academy of Sciences, 2017 (邵丰伟. 卫星导航系统星间链路网络建链路由技术研究[学位论文]. 北京: 中国科学院大学, 2017) [4] Huang J H. Research on Optimal Design Technology of Inter-satellite Link Network in Satellite Navigation System [Dissertation]. Changsha: National University of Defense Technology, 2018 (黄今辉. 卫星导航系统星间链路网络优化设计技术研究[学位论文]. 长沙: 国防科技大学,2018) [5] L. Hao, P. Ren, Q. Du. Satellite QoS Routing Algorithm Based on Energy Aware and Load Balancing // International Conference on Wireless Communications and Signal Processing. Nanjing, 2020: 685 [6] Gao H, Wang L, Huang W D, et al. Route optimization method for fast return of overseas satellite data of BeiDou global satellite navigation system. Chinese Space Science and Technology, 2018, 38 (3): 9 (高贺, 王玲, 黄文德, 等. 北斗全球卫星导航系统境外星数据快速回传的路由优化方法. 中国空间科学技术, 2018, 38 (3): 9) [7] Liao G Y. Research on routing algorithm of low-orbit satellite network based on inter-satellite link [Dissertation]. Chongqing: Chongqing University of Posts and Telecommunications, 2020 (廖光燕. 基于星间链路的低轨卫星网络路由算法研究[学位论文]. 重庆: 重庆邮电大学, 2020) [8] Li X T, Zhang Y S. A SDN network artificial intelligence routing method suitable for low-orbit satellites. Electronic Measurement Technology, 2020, 43 (22): 109 (李新桐, 张亚生. 一种适用于低轨卫星的 SDN 网络人工智能路由方法. 电子测量技术, 2020, 43 (22): 109) 录用稿件,非最终出版稿