2.3 模型测试算法 LS-Net 测试时同样使用前 3 天的数据预测第

正在加载图片...

·532· 智能系统学报第16卷 2.3模型测试算法 6)End while LS-Net测试时同样使用前3天的数据预测第 4天的数据。但由于疫情趋势预测是对疫情在未 3实验及结果来较长时间段内的发展趋势进行预测，而当下无为验证LS-Net的效果，本文使用Pytorch深法获得未来时间下的E、I、R具体数据，因此本文度学习框架和Python语言搭建预测模型。Py- 将模型的输出与上一组输入中的后2天数据相结 thon版本为3.6。使用云南省、上海市和陕西省合，组成新的输入数据再次输入到模型中进行计 3个地区的疫情数据创建数据集进行实验并与算。若对未来n天的疫情趋势进行预测，则测试传统SEIR模型进行对比。本节将对实验数据算法流程如图4所示，测试算法见算法2。集、实验参数设置进行介绍并对实验结果进行开始分析。 3.1数据收集及整理 d- 、74 1)数据来源：2019年12月8日一2020年 3月28日全国各省市卫生健康委员会公布的疑 d-0 似病例、确诊病例、治愈和死亡病例（后文简称移除病例)数据。 d≤n 2)数据选取：LS-Net没有考虑不同地区之间人员流动的因素，因此选取了武汉实施全面封城后的2020年1月24日一2020年3月28日的数输入只包含3天数据的X 据进行实验，以尽量减少人员流动对实验结果带来的影响。在全国的总体数据中，确诊病例和移由式()、(6)、(7计算B,、B 除病例大部分来自于湖北省。而早期由于检测手段跟不上，湖北省存在大量患者不能及时得到确由式(8)预测Y, 诊和无法对疑似病例进行排查的情况，所以早期输出Y 全国总体数据与现实情况有较大差距。为此本文没有使用全国总体数据进行实验，而是从除湖北将X中的后2天数省外同时记录有疑似病例、确诊病例和移除病例据与Y组合为新的X 的省市中挑选了云南省、上海市和陕西省3个地区的数据进行实验。 d++ 3)数据集准备：早期无法对人群的病毒感染情况进行排查，还未出现感染症状的潜伏期患者结束数据难以被记录，因此，本文使用现存疑似病例图4测试算法流程 (已出现病毒感染临床症状但还未得到核酸检测 Fig.4 Testing algorithm flow 结果的病例)数作为E,现存确诊病例数作为（现算法2模型测试存确诊病例数=累计确诊病例数-累计移除病例输入测试集初始输入X={X+,X,={E,-1, 数)，移除病例数作为R,各地区2019年常住人口 IT-1,RI-1,ET:IT:RT:ET+2,11+2.RT+21o 数作为N。将第1~1+2天的数据作为输人，第输出模型预测结果Y={Y+,Y+2…,Yd, +3天的数据作为对应标签来进行整理，共得到其中Y7d={Er+d4,rd41,Rrd4il,de[l,则。 62份数据。参数d:已测试的天数。 4)数据集划分：将3)得到的数据按训练集规 l)While d≤ndo 模大小的不同分别整理出4个数据集，即Set10 2)由式(5)、(6)、(7)计算病毒传染率B、B2 Set20、Set30、Set40。其中Set10划分规则：前 3)由式(8)计算新冠肺炎疫情趋势Y+ 10份数据作为训练集，后52份数据的标签作为 4)d←-d+1/更新已测试天数测试集的标签，第11份输入数据作为测试集的初 5)Xid+concat (E+d-2,Ind-2.R+d-2,Ed-1.Id-1. 始输入数据。Set20、Set30、Set40划分规则 R+d-1,Y+d-1)/便新输人数据同理。2.3 模型测试算法 LS-Net 测试时同样使用前 3 天的数据预测第 4 天的数据。但由于疫情趋势预测是对疫情在未来较长时间段内的发展趋势进行预测，而当下无法获得未来时间下的 E、I、R 具体数据，因此本文将模型的输出与上一组输入中的后 2 天数据相结合，组成新的输入数据再次输入到模型中进行计算。若对未来 n 天的疫情趋势进行预测，则测试算法流程如图 4 所示，测试算法见算法 2。开始 d←0 输入只包含 3 天数据的 X 输出 Yt 结束 Y N α← 、 1 7 γ ←1 14 d ≤n 由式 (5)、(6)、(7) 计算 β1t、β2t 由式 (8)预测 Yt 将 X 中的后 2 天数据与 Yt 组合为新的 X d++ 图 4 测试算法流程 Fig. 4 Testing algorithm flow 算法 2 模型测试 X = {XT+1} XT = {ET−1, IT−1,RT−1,ET ,IT ,RT ,ET+2,IT+2,RT+2} 输入测试集初始输入，。 Y = {YT+1,YT+2,··· ,YT+d} YT+d = {ET+d+1,IT+d+1,RT+d+1} d ∈ [1,n] 输出模型预测结果，其中，。参数 d：已测试的天数。 1)While d ⩽ n do 2 β1t+d β2t+d ) 由式 (5)、(6)、(7) 计算病毒传染率、 3) 由式 (8) 计算新冠肺炎疫情趋势 Yt+d 4) d ← d +1 //更新已测试天数 Xt+d ← concat (Et+d−2, It+d−2, Rt+d−2, Et+d−1, It+d−1, Rt+d−1, Yt+d−1) 5) //更新输入数据 6)End while 3 实验及结果为验证 LS-Net 的效果，本文使用 Pytorch 深度学习框架和 Python 语言搭建预测模型。Python 版本为 3.6。使用云南省、上海市和陕西省 3 个地区的疫情数据创建数据集进行实验并与传统 SEIR 模型进行对比。本节将对实验数据集、实验参数设置进行介绍并对实验结果进行分析。 3.1 数据收集及整理 1) 数据来源：2019 年 12 月 8 日—202 0 年 3 月 28 日全国各省市卫生健康委员会公布的疑似病例、确诊病例、治愈和死亡病例 (后文简称移除病例) 数据。 2) 数据选取：LS-Net 没有考虑不同地区之间人员流动的因素，因此选取了武汉实施全面封城后的 2020 年 1 月 24 日—2020 年 3 月 28 日的数据进行实验，以尽量减少人员流动对实验结果带来的影响。在全国的总体数据中，确诊病例和移除病例大部分来自于湖北省。而早期由于检测手段跟不上，湖北省存在大量患者不能及时得到确诊和无法对疑似病例进行排查的情况，所以早期全国总体数据与现实情况有较大差距。为此本文没有使用全国总体数据进行实验，而是从除湖北省外同时记录有疑似病例、确诊病例和移除病例的省市中挑选了云南省、上海市和陕西省 3 个地区的数据进行实验。 3) 数据集准备：早期无法对人群的病毒感染情况进行排查，还未出现感染症状的潜伏期患者数据难以被记录，因此，本文使用现存疑似病例 (已出现病毒感染临床症状但还未得到核酸检测结果的病例) 数作为 E，现存确诊病例数作为 I(现存确诊病例数=累计确诊病例数−累计移除病例数)，移除病例数作为 R，各地区 2019 年常住人口数作为 N。将第 t~t+2 天的数据作为输入，第 t+3 天的数据作为对应标签来进行整理，共得到 62 份数据。 4) 数据集划分：将 3) 得到的数据按训练集规模大小的不同分别整理出 4 个数据集，即 Set_10、 Set_20、Set_30、Set_40。其中 Set_10 划分规则: 前 10 份数据作为训练集，后 52 份数据的标签作为测试集的标签，第 11 份输入数据作为测试集的初始输入数据。Set_20、Set_30、Set_40 划分规则同理。 ·532· 智能系统学报第 16 卷

<<向上翻页向下翻页>>

点击下载：【人工智能基础】新冠肺炎疫情趋势预测模型