基于机器学习的地表水ICM浓度预测方法和系统_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

基于机器学习的地表水ICM浓度预测方法和系统

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


基于机器学习的地表水ICM浓度预测方法和系统
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及地表水污染研究,尤其涉及基于机器学习的地表水icm浓度预测方法和系统。、icm的全称是碘代x射线造影剂,是目前使用最广泛的血管内给药,由于具有高剂量施用、不被人体代谢分解且难以被传统水处理工艺去除的特点,icm以较高的浓度随污水处理厂出水被排放进入水环境中。icm的高水溶性导致其...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及地表水污染研究,尤其涉及基于机器学习的地表水icm浓度预测方法和系统。背景技术:1、icm的全称是碘代x射线造影剂,是目前使用最广泛的血管内给药,由于具有高剂量施用、不被人体代谢分解且难以被传统水处理工艺去除的特点,icm以较高的浓度随污水处理厂出水被排放进入水环境中。icm的高水溶性导致其极易在自然水体中转移扩散,已在不同国家和地区的污水、地表水、地下水和饮用水中被广泛检出,对生态系统和人类健康带来潜在威胁。2、为监测地表水中的icm污染情况,要对水样进行采集、提取和分析,目前通常使用固相萃取结合液相色谱质谱联用法,检测过程繁琐,方法复杂,耗费成本高。此外,icm浓度水平和环境指标之间的相关关系研究几乎空白,而建立污染物与常规指标的联系有助于了解污染物的驱动因素和环境归趋,为改善污染提供有利指导。3、随着计算机软件技术的发展,机器学习显示出其解决复杂环境问题方面的可行性和高效率。机器学习方法可以通过数据分析,找出影响污染物浓度变化的重要特征因子并实现污染预报。因此,研究利用机器学习方法对地表水中的icm浓度进行快速、准确的预测,挖掘影响icm污染的关键因素,具有重要意义。技术实现思路1、为了克服上述现有技术的不足,本发明提供了一种基于机器学习的地表水icm污染影响因素分析及浓度预测方法和系统。本发明的第一个目的在于判断不同环境指标对icm污染的影响,识别出关键的环境指标,本发明的第二个目的在于提供地表水中icm浓度预测的方法,改善icm检测分析工作量大、缺乏数据积累的现状,为icm污染监测提供新的思路。2、鉴于上述问题,本发明提供了一种基于机器学习的地表水icm污染影响因素分析及浓度预测方法和系统。3、本发明一方面提供的基于机器学习的地表水icm污染影响因素分析及浓度预测方法的技术方案是:4、一种基于机器学习的地表水icm污染影响因素分析及浓度预测方法,该方法通过一种基于机器学习的地表水icm污染影响因素分析及浓度预测系统实现,其中,所述方法包括以下步骤:5、步骤一,获取地表水样品集,并基于所述地表水样品集构建数据集;通过固相萃取结合液相色谱质谱技术对水样进行处理和检测,得到icm浓度数据,其中,所述icm浓度数据包括多类icm浓度数据;6、步骤二,获取可能影响icm浓度水平的环境指标数据,其中,水质指标通过理化指标仪进行测定,气象指标数据通过气象资料查询网站获取;7、步骤三,将所述地表水中的总icm浓度数据,所述水质指标数据和气象指标数据进行归纳整理,构建数据集,使用z-score法对数据进行标准化预处理;8、步骤四,将所述的环境指标作为输入特征,以icm浓度作为输出特征,依次使用单变量线性回归测试、互信息、敏感性分析特征筛选方法来选择合适的输入特征。依次使用每种特征筛选方法,识别输入特征对输出特征的预测能力,由此获得每种环境指标的特征重要性值。依据特征重要性值,由大到小来对指标进行排序,通过依次增加输入模型的特征数,获得多个特征子集;9、步骤五,将每种特征筛选方法获得的多个特征子集代入多层感知器(mlp)模型,使用遗传算法优化模型的超参数,进行5折交叉验证并计算评价指标的平均值,通过对比模型交叉验证评价指标的均值,得到每种特征筛选方法获取的表现最好的特征子集,并进一步对比选取评价指标最优的特征子集作为最终的最优特征子集;10、步骤六,利用最优特征子集中每个环境指标参数的特征重要性值,进行地表水icm污染影响因素分析;11、步骤七,将最优特征子集代入mlp模型,在最佳超参数条件下预测对应的总icm浓度。12、本发明另一方面提供的基于机器学习的地表水icm污染影响因素分析及浓度预测系统的技术方案是:13、一种基于机器学习的地表水icm污染影响因素分析及浓度预测系统,用于执行所述的一种基于机器学习的地表水icm污染影响因素分析及浓度预测方法,其中,所述系统包括:14、数据获取模块,所述数据获取模块用于通过固相萃取结合液相色谱质谱技术检测地表水中的icm浓度,获得目标icm浓度数据,并通过理化指标仪和气象资料查询网站获取可能影响icm浓度水平的环境指标数据;15、数据预处理模块,所述数据预处理模块用于对获取的数据进行归纳整理,构建数据集并进行标准化处理;16、训练模块,所述特征筛选模块用于依次使用单变量线性回归测试、互信息、敏感性分析对所述多个环境指标进行特征重要性值的排序,得到多个特征子集,将所有特征子集代入mlp模型,使用遗传算法进行超参数优化,通过5折交叉验证得到每种筛选方法对应的表现最好的特征子集;将所有特征筛选方法获取的表现最好的特征子集进行比较,选取最优评价指标对应的特征子集作为最终的最优特征子集;17、icm污染影响因素分析模块,所述icm污染影响因素分析模块基于最优特征子集中每个环境指标的重要性值,表示环境指标对icm浓度的重要程度,由此分析影响地表水中icm污染的关键环境因素;18、icm浓度预测模块,所述浓度预测模块搭载有训练好的mlp模型,所述mlp模型的输入特征是筛选的最优特征子集,输出为icm的浓度值。19、本发明一方面提供的计算机网络服务系统的技术方案是:20、一种计算机网络服务系统,搭载有特征筛选和模型程序。该系统包括前端和后端两部分,前端通过输入模块接收数据,将其送入后端执行计算,实现如上所述的基于机器学习的地表水icm污染影响因素分析及浓度预测方法中的步骤,获得的结果通过网络服务返回至前端显示。21、本发明一方面提供的计算机储存介质的技术方案是:22、一种计算机储存介质,用于存储和管理预测模型、历史数据和计算结果,以便后续查询和分析。采用计算机存储介质,如硬盘、固态硬盘或云存储服务等,用于长期保存和管理预测模型、历史数据、计算结果。用户可以随时访问和查询以往的计算结果,进行数据分析和趋势预测,以支持决策和管理。利用计算机存储介质还可以实现数据备份和恢复的功能,确保数据的安全性和可靠性。在系统升级或故障恢复的情况下,可以通过存储介质中的备份数据进行数据恢复,避免数据丢失和损坏。23、本发明中提供的一个或多个技术方案,至少具有如下的有益效果:24、(1)本发明提供的地表水icm污染影响因素分析及浓度预测的模型,不但可以协助理解icm污染与环境指标间的复杂关系,还可以根据环境指标对icm浓度进行预测,降低水体icm污染检测的成本,避免水体icm污染监测的资源浪费;25、(2)本发明对比多种特征筛选方法来确定最优特征子集,降低了数据纬度,增加了数据的简洁性和可读性,提高数据处理和分析的效率,只选用少数能解释icm浓度变量的特征且可以使模型更稳定,提高了模型的精度;26、(3)本发明使用遗传算法结合5折交叉验证进行模型的超参数优化,可以实现超参数的多样性,有助于避免陷入局部最优解,并且能在数据集较小的情况下避免过拟合,从而提高模型的性能和泛化能力;27、(4)本发适用于对不同的地表水样本采用不同的特征子集,实现不同场景下的icm污染影响因素分析及icm的浓度预测,并且随着使用次数的增加,模型可以进行自主优化,使得预测结果越来越准确。

基于机器学习的地表水ICM浓度预测方法和系统