一种基于CNN-BiLSTM-BO的气溶胶化学组分的重构方法
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及气溶胶检测领域,尤其涉及一种基于cnn-bilstm-bo的气溶胶化学组分的重构方法及系统。、气溶胶包含硫酸盐(so-)、硝酸盐(no-)、铵盐(nh)、有机物(om)及元素碳(ec)或黑碳(bc),这些组分具有不同的来源、形成机理及对气候和健康的影响。例如,bc和so-对痴呆症... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及气溶胶检测领域,尤其涉及一种基于cnn-bilstm-bo的气溶胶化学组分的重构方法及系统。背景技术:1、气溶胶包含硫酸盐(so42-)、硝酸盐(no3-)、铵盐(nh4+)、有机物(om)及元素碳(ec)或黑碳(bc),这些组分具有不同的来源、形成机理及对气候和健康的影响。例如,bc和so42-对痴呆症影响显著,而no3-和oc影响较小。因此,准确表征气溶胶化学组分对于制定减排策略和评估健康及气候效应非常重要。2、在现有技术中,气溶胶组分的探测技术主要依赖于化学分析和数值模拟。化学分析如离子色谱和热/光反射法,虽精确但是成本高,且受限于低时空分辨率和仪器精度,此外,大气化学传输模型容易受到排放清单、气象场、物理化学机制和初始边界条件等不确定因素的影响。数值模拟虽然可以模拟气溶胶的形成和传播过程,但容易受到排放清单和气象条件等不确定因素的影响。相比之下,基于概率论和数理统计的机器学习技术提供了一种更高效的方法,不受这些限制,机器学习分为监督学习、非监督学习和强化学习。其中,监督学习适用于建立输入和输出关系,但是线性算法如arima和mlr和gwr算法等无法捕捉复杂的非线性关系,其精确度和泛化能力有限。传统的非线性算法如svm和随机森林虽改善了这一点,但深度学习技术如cnn和lstm在表征气溶胶化学组分方面的准确性、泛化能力和可解释性还有待提高。技术实现思路1、本发明的目的是针对上述技术问题,提出一种基于cnn-bilstm-bo的气溶胶化学组分的重构方法及系统,在不依赖于传统化学分析技术的基础上,准确重构出多种气溶胶化学组分(铵盐nh4+、硫酸盐so42-、硝酸盐no3-、有机物om和元素物em),解决化学组分观测成本高、数据缺失、以及多源观测数据在变量类型上不协调的问题,本发明的目的可通过下列技术方案来实现:2、本发明提供了一种基于cnn-bilstm-bo的气溶胶化学组分的重构方法,包括以下步骤:3、步骤s1、通过观测设备收集多源环境观测数据,并进行预处理和提取关键特征变量;4、步骤s2、将预处理后的所述多源环境观测数据输入到cnn-bilstm模型进行特征分析,其中,卷积神经网络提取空间特征并使用双向长短期记忆神经网络处理时间序列信息,同时通过贝叶斯优化算法对所述cnn-bilstm调整超参数,生成气溶胶化学组分的重构模型;5、步骤s3、验证所述重构模型性能和稳定性后,输出所述气溶胶化学组分的预测结果。6、进一步的,在步骤s2中,所述卷积神经网络提取空间特征,包括,将所述多源环境观测数据的多变量时间序列折叠成多变量数组,完成在每个时间步进行独立的卷积操作;通过沿着水平和垂直方向对所述多源环境观测数据的每个时间步进行独立的卷积计算,通过卷积核提取局部特征并通过批量归一化和修正线性单元进行标准化和非线性处理;使用序列展开层重新构建所述多源环境观测数据的时间序列结构,并通过展平层将空间维度折叠到变量维度。7、进一步的,在步骤s2中,所述使用双向长短期记忆神经网络处理时间序列信息,包括,双向长短期记忆层通过前向和后向的方式从所述卷积神经网络输入数据中的时间特征,同时捕捉过去和未来信息;通过丢弃层随机去除一定比例的神经元;使用全连接层对所述双向长短期记忆层的输出结果进行维度转换以匹配目标输出大小,最后所述回归输出层输出所述气溶胶化学组分的回归估计。8、进一步的,在步骤s2中,所述通过贝叶斯优化算法调整超参数,包括,9、构建所述cnn-bilstm模型的目标函数,并随机在决策空间中选择一组初始超参数作为初始决策向量,计算所述目标函数的值并获取先验概率分布,并通过控制参数控制最大迭代次数和计算时间;10、通过实际观测值更新所述目标函数高斯过程回归模型的似然分布,从中推导出后验概率分布来反映所述目标函数的更新情况;11、基于所述后验概率分布,最大化采集函数取值来确定下一个最优采样点,并继续更新对应的所述先验概率分布,持续迭代,直至确定所述目标函数的最小值对应的超参数组合,所述超参数组合为对应的最优解。12、进一步的,在步骤s211中,构建所述cnn-bilstm模型的目标函数,并随机在决策空间中选择一组初始超参数作为初始决策向量,计算所述目标函数的值并获取先验概率分布,包括,13、p(f(x|input)|y)=p(y|f(x|input))p(f(x|input))/p(y);14、15、其中,x是由d个超参数组成的决策向量,x是决策空间,input为输入数据,x*为最优超参数组合向量。f(x|input)是目标函数,y是实际观测值,p(y|f(x|input))是似然分布,p(f(x|input))是先验概率分布,即对f(x|input)的估计,p(y)是边缘似然分布,p(f(x|input)|y)是后验概率分布,即f(x|input)的置信系数。16、进一步的,在步骤s211中,通过实际观测值更新所述目标函数高斯过程回归模型的似然分布,从中推导出后验概率分布来反映所述目标函数的更新情况,包括,17、f(x|input)~gp(mean(x),k(x,x';θ));18、19、θ1=σf2,σf>0;20、θ2=σl,σl>0;21、其中,gp(mean(x),k(x,x';θ))为所述高斯过程回归模型,由均值函数mean(x)和协方差核函数k(x,x';θ)组成;所述k(x,x';θ)为matern 5/2协方差核函数,该函数中的x和x'表示为任意两个坐标点,θ为核参数向量,σf为信号标准偏差,σl为特征长度尺度。22、进一步的,基于所述后验概率分布,最大化采集函数取值来确定下一个最优采样点,并继续更新对应的所述先验概率分布,持续迭代,直至确定所述目标函数的最小值对应的超参数组合,所述超参数组合为对应的最优解,包括,23、ei(x,p)=ep[max(0,μp(xbest)-f(x|input))];24、eips(x)=eip(x)/μs(x);25、σp2(x)=σf2(x)+σ2,σf(x)