一种基于图像深度学习网络集成模型的流感预测
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明属于流行病监测,具体涉及一种基于图像深度学习网络集成模型的流感预测方法。、流行性感冒,是一种由流感病毒引起的常见急性呼吸道传染病。因其具有潜伏期短、传播性强、传播速度快的特点,一旦出现,会导致感染人数在短时间内大量增加,同时部分流感重症患者会进一步出现并发症从而对生命造成威胁。预防流... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明属于流行病监测,具体涉及一种基于图像深度学习网络集成模型的流感预测方法。背景技术:1、流行性感冒,是一种由流感病毒引起的常见急性呼吸道传染病。因其具有潜伏期短、传播性强、传播速度快的特点,一旦出现,会导致感染人数在短时间内大量增加,同时部分流感重症患者会进一步出现并发症从而对生命造成威胁。预防流感最有效的方法是按时准备流感疫苗,然而这种长期战略存在很大的不确定性,会导致流感季节中流感疫苗的供需不平衡;因此,在现有的流感监测基础上,积极开展流感预测并提前实施预防干预,对于流感防控至关重要。2、为了实现对流感传播更加精准的监测与预测,国内外学者利用机器学习方法对流感时间序列进行建模,这些方法通过筛选与流感相关系数高的时间序列作为特征输入,通过模型完成流感预测。然而当前流感预测模型通常采用传统流感监测数据作为一维数字流感序列进行预测,这种方法在特征提取方面存在局限,无法有效挖掘序列中的深层信息,从而影响模型预测精度。技术实现思路1、针对现有方法在特征提取方面存在局限,无法有效挖掘序列中的深层信息,从而影响其预测精度这一问题,本发明提供了一种基于图像深度学习网络集成模型的流感预测方法。2、为了达到上述目的,本发明采用了下列技术方案:3、步骤1,数据预处理;输入原始单变量流感序列,并对其进行窗口滑动切片,通过格拉姆角场对切片子序列进行图像编码;4、进一步地,步骤1的具体操作为:5、步骤1.1,由于外部因素造成流感数据波动较大,因此将采集到的来自国家流感中心的数据以2019年为节点分为两组数据,即2013年第27周到2019年38周和2019年38周到2023年第52周的流感数据,分别进行窗口为36个样本值的滚动切片并将其规范化至[0,1]区间内;6、步骤1.2,通过格拉姆角场对切片子序列进行图像编码,将每一个切片子序列编码为一张灰度图像作为模型输入样本保存;格拉姆角场图像编码公式如下:7、8、其中,和均表示序列观测值的角度化表示,和均表示规范化后的流感序列观测值向量;9、步骤2,搭建sresmdm基础模型;sresmdm基础模型结构分为两部分,第一部分为流感特征提取模块,使用resnet深度学习神经网络,将图像编码后的子序列作为输入样本,进行特征值提取;第二部分为流感预测模块,使用mlp机器学习神经网络,输入第一部分处理的子序列进行流感预测;10、进一步地,步骤2的具体操作为:11、步骤2.1,随着深度神经网络的层数增加,深度学习模型可能会出现梯度弥漫或梯度爆炸等问题,因此采用resnet深度学习神经网络的基本思想,构建流感特征提取模块,该思想利用各层之间的“快捷连接方式”,使基础残差块的输入信息能够直接映射到其输出,利用残差信息最大可能的避免了梯度弥漫或梯度爆炸等问题,sresmdm基础模型映射如下:12、13、其中,relu表示relu激活函数层,bn表示批规范化层,conv表示卷积网络层,pool表示最大池化层,concat表示模块堆积;而fblock(x)表示模型基础单元的搭建映射,fblock(x)表示模型基础块的搭建映射,fstack(x)表示模型基础堆栈的搭建映射,ffinal表示模型的最终映射。14、步骤2.2,基于计算时间和资源方面的考虑,选择需要更少时间和计算资源的mlp机器学习神经网络的基本思想,构建流感预测模块,sresmdm基础模型公式如下:15、16、其中,δ为激活函数relu函数,w是参数向量,b是偏置值,为模型最终预测值,为模型特征提取模块输出的特征向量;17、步骤3,优化模型进行预测;使用麻雀搜索优化算法对模型重要参数进行优化,利用优化后的参数建立最终非线性流感预测模型,最后通过对比分析预测效果评估预测模型优势;18、进一步地,步骤3的具体操作为:19、步骤3.1,为更好的提升模型性能和鲁棒性,采用麻雀搜索优化算法根据模型基础残差块数、堆栈数、初始过滤器数三个维度进行麻雀种群初始化,按照20%的比例设置其中探索者和警戒者占比,根据计算的适应度值将种群划分为探索者和追随者;20、步骤3.2,在对模型基础残差块数、堆栈数、初始过滤器数三个重要参数训练中,不断更新算法中探索者、追随者、警戒者的位置,在训练结束后找到最佳参数配置,将该配置返回到模型中,构建最终模型进行测试,最后利用公式(3)计算得出预测结果;21、探索者位置更新的公式如下:22、23、其中,表示在当前迭代数中麻雀个体的位置,itermax为最大迭代次数,α为[0,1]内的随机数,q是服从标准正态分布的随机数,l是元素均为1的1×d矩阵,r2∈[0,1]是预警值、st∈[0.5,1]是安全值;当r2<st时,代表周围没有天敌,探索者会进行全局搜索;当r2≥st时,代表个别麻雀发现天敌并发出警报;24、追随者位置更新的公式如下:25、26、其中,xworst是全局最差的位置,xp是目前探索者所占据的最优位置,a+=at(aat)-1,其中a是元素随机赋值为1或-1的1×d矩阵;当i>n/2时,表明适应度较低的第i个追随者状态极差,将飞往其他地方觅食,以获取更多食物;27、警戒者位置更新的公式如下:28、29、其中,xbest是当前全局最优位置,β是服从标准正态分布的步长控制参数,k∈[-1,1]是一个随机数,表示麻雀移动方向,fi是当前麻雀个体的适应度值,fg和fw分别是当前全局最佳和最差适应度值,ε是一个极小常数,避免分母出现零;当fi>fg时,表示当前麻雀个体处于种群边缘,极容易受到天敌的攻击;当fi=fg时,表示位于种群中间的麻雀意识到了天敌威胁,需要与其他麻雀相互靠近以避免被捕食;30、步骤3.3,选用平均绝对标度误差(mase)和对称平均绝对百分比误差(smape)作为评价指标,使用步骤3.2中的预测结果来评估模型性能,具体表达式如下:31、32、33、其中,yt为t时刻流感真实值,为t时刻流感模型预测值,n为流感历史观测值数量;mase表示预测误差除以平均预测误差所得的值,smape表示对称平均绝对误差的百分比值。34、与现有技术相比本发明具有以下优点:35、(1)本发明利用格拉姆角场图像编码,使流感序列数据由一维数字转为二维图像作为模型输入,不仅有助于保留数据的原始信息,还能充分发挥卷积神经网络在图像处理方面的卓越能力,挖掘到图像独特的空间特征,同时利用卷积网络捕捉局部特征的能力,避免模型对特征工程的依赖,在前期没有进行数据筛选和相关性分析的基础上,使发明依然具有卓越的预测性能。36、(2)由于外部因素造成流感数据波动较大,现有技术很难做到在没有协变量的情况下预测性能保持稳定。然而通过两段数据的对比分析,即使由于外部因素造成了数据波动,在没有协变量的情况下,本发明依旧可以在保持模型稳定性的同时,提升效率和预测性能。