正在加载图片...
·532· 智能系统学报 第16卷 2.3模型测试算法 6)End while LS-Net测试时同样使用前3天的数据预测第 4天的数据。但由于疫情趋势预测是对疫情在未 3实验及结果 来较长时间段内的发展趋势进行预测,而当下无 为验证LS-Net的效果,本文使用Pytorch深 法获得未来时间下的E、I、R具体数据,因此本文 度学习框架和Python语言搭建预测模型。Py- 将模型的输出与上一组输入中的后2天数据相结 thon版本为3.6。使用云南省、上海市和陕西省 合,组成新的输入数据再次输入到模型中进行计 3个地区的疫情数据创建数据集进行实验并与 算。若对未来n天的疫情趋势进行预测,则测试 传统SEIR模型进行对比。本节将对实验数据 算法流程如图4所示,测试算法见算法2。 集、实验参数设置进行介绍并对实验结果进行 开始 分析。 3.1数据收集及整理 d- 、74 1)数据来源:2019年12月8日一2020年 3月28日全国各省市卫生健康委员会公布的疑 d-0 似病例、确诊病例、治愈和死亡病例(后文简称移 除病例)数据。 d≤n 2)数据选取:LS-Net没有考虑不同地区之间 人员流动的因素,因此选取了武汉实施全面封城 后的2020年1月24日一2020年3月28日的数 输入只包含3天数据的X 据进行实验,以尽量减少人员流动对实验结果带 来的影响。在全国的总体数据中,确诊病例和移 由式()、(6)、(7计算B,、B 除病例大部分来自于湖北省。而早期由于检测手 段跟不上,湖北省存在大量患者不能及时得到确 由式(8)预测Y, 诊和无法对疑似病例进行排查的情况,所以早期 输出Y 全国总体数据与现实情况有较大差距。为此本文 没有使用全国总体数据进行实验,而是从除湖北 将X中的后2天数 省外同时记录有疑似病例、确诊病例和移除病例 据与Y组合为新的X 的省市中挑选了云南省、上海市和陕西省3个地 区的数据进行实验。 d++ 3)数据集准备:早期无法对人群的病毒感染 情况进行排查,还未出现感染症状的潜伏期患者 结束 数据难以被记录,因此,本文使用现存疑似病例 图4测试算法流程 (已出现病毒感染临床症状但还未得到核酸检测 Fig.4 Testing algorithm flow 结果的病例)数作为E,现存确诊病例数作为(现 算法2模型测试 存确诊病例数=累计确诊病例数-累计移除病例 输入测试集初始输入X={X+,X,={E,-1, 数),移除病例数作为R,各地区2019年常住人口 IT-1,RI-1,ET:IT:RT:ET+2,11+2.RT+21o 数作为N。将第1~1+2天的数据作为输人,第 输出模型预测结果Y={Y+,Y+2…,Yd, +3天的数据作为对应标签来进行整理,共得到 其中Y7d={Er+d4,rd41,Rrd4il,de[l,则。 62份数据。 参数d:已测试的天数。 4)数据集划分:将3)得到的数据按训练集规 l)While d≤ndo 模大小的不同分别整理出4个数据集,即Set10 2)由式(5)、(6)、(7)计算病毒传染率B、B2 Set20、Set30、Set40。其中Set10划分规则:前 3)由式(8)计算新冠肺炎疫情趋势Y+ 10份数据作为训练集,后52份数据的标签作为 4)d←-d+1/更新已测试天数 测试集的标签,第11份输入数据作为测试集的初 5)Xid+concat (E+d-2,Ind-2.R+d-2,Ed-1.Id-1. 始输入数据。Set20、Set30、Set40划分规则 R+d-1,Y+d-1)/便新输人数据 同理。2.3 模型测试算法 LS-Net 测试时同样使用前 3 天的数据预测第 4 天的数据。但由于疫情趋势预测是对疫情在未 来较长时间段内的发展趋势进行预测,而当下无 法获得未来时间下的 E、I、R 具体数据,因此本文 将模型的输出与上一组输入中的后 2 天数据相结 合,组成新的输入数据再次输入到模型中进行计 算。若对未来 n 天的疫情趋势进行预测,则测试 算法流程如图 4 所示,测试算法见算法 2。 开始 d←0 输入只包含 3 天数据的 X 输出 Yt 结束 Y N α← 、 1 7 γ ←1 14 d ≤n 由式 (5)、(6)、(7) 计算 β1t、β2t 由式 (8)预测 Yt 将 X 中的后 2 天数 据与 Yt 组合为新的 X d++ 图 4 测试算法流程 Fig. 4 Testing algorithm flow 算法 2 模型测试 X = {XT+1} XT = {ET−1, IT−1,RT−1,ET ,IT ,RT ,ET+2,IT+2,RT+2} 输入 测试集初始输入 , 。 Y = {YT+1,YT+2,··· ,YT+d} YT+d = {ET+d+1,IT+d+1,RT+d+1} d ∈ [1,n] 输出 模型预测结果 , 其中 , 。 参数 d:已测试的天数。 1)While d ⩽ n do 2 β1t+d β2t+d ) 由式 (5)、(6)、(7) 计算病毒传染率 、 3) 由式 (8) 计算新冠肺炎疫情趋势 Yt+d 4) d ← d +1 //更新已测试天数 Xt+d ← concat (Et+d−2, It+d−2, Rt+d−2, Et+d−1, It+d−1, Rt+d−1, Yt+d−1) 5) //更新输入数据 6)End while 3 实验及结果 为验证 LS-Net 的效果,本文使用 Pytorch 深 度学习框架和 Python 语言搭建预测模型。Py￾thon 版本为 3.6。使用云南省、上海市和陕西省 3 个地区的疫情数据创建数据集进行实验并与 传统 SEIR 模型进行对比。本节将对实验数据 集、实验参数设置进行介绍并对实验结果进行 分析。 3.1 数据收集及整理 1) 数据来源:2019 年 12 月 8 日—202 0 年 3 月 28 日全国各省市卫生健康委员会公布的疑 似病例、确诊病例、治愈和死亡病例 (后文简称移 除病例) 数据。 2) 数据选取:LS-Net 没有考虑不同地区之间 人员流动的因素,因此选取了武汉实施全面封城 后的 2020 年 1 月 24 日—2020 年 3 月 28 日的数 据进行实验,以尽量减少人员流动对实验结果带 来的影响。在全国的总体数据中,确诊病例和移 除病例大部分来自于湖北省。而早期由于检测手 段跟不上,湖北省存在大量患者不能及时得到确 诊和无法对疑似病例进行排查的情况,所以早期 全国总体数据与现实情况有较大差距。为此本文 没有使用全国总体数据进行实验,而是从除湖北 省外同时记录有疑似病例、确诊病例和移除病例 的省市中挑选了云南省、上海市和陕西省 3 个地 区的数据进行实验。 3) 数据集准备:早期无法对人群的病毒感染 情况进行排查,还未出现感染症状的潜伏期患者 数据难以被记录,因此,本文使用现存疑似病例 (已出现病毒感染临床症状但还未得到核酸检测 结果的病例) 数作为 E,现存确诊病例数作为 I(现 存确诊病例数=累计确诊病例数−累计移除病例 数),移除病例数作为 R,各地区 2019 年常住人口 数作为 N。将第 t~t+2 天的数据作为输入,第 t+3 天的数据作为对应标签来进行整理,共得到 62 份数据。 4) 数据集划分:将 3) 得到的数据按训练集规 模大小的不同分别整理出 4 个数据集,即 Set_10、 Set_20、Set_30、Set_40。其中 Set_10 划分规则: 前 10 份数据作为训练集,后 52 份数据的标签作为 测试集的标签,第 11 份输入数据作为测试集的初 始输入数据。Set_20、Set_30、Set_40 划分规则 同理。 ·532· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有