家居专利数据库

基于半监督卷积阶梯网络的化工装置软测量方法

发布日期:2024-08-21 浏览次数:

本发明涉及软测量,具体地涉及一种基于半监督卷积阶梯网络的化工装置软测量方法、一种基于半监督卷积阶梯网络的化工装置软测量装置、一种基于半监督卷积阶梯网络的化工装置软测量设备以及一种计算机可读存储介质。背景技术:1、化工生产中,基于机器学习的软测量能够实现质量指标的在线监测,日益受到重视。然而,由于实验室信息管理系统(lims)的采样频率远低于分布式控制系统(dcs),主导变量和关联变量的数据量不平衡,致使一方面可用于训练模型的有标签样本稀少,预测精度不足;另一方面,又存在大量的无标签数据未得到充分利用,存在极大资源浪费。半监督学习(semi-supervised learning,ssl)模型是解决上述难题的可行方案之一。ssl可以同步开展有监督和无监督学习,并整合二者的优势:从大量的无标签数据中捕获潜在信息,表征过程数据的全局结构和分布规律,再辅助少量的有标签样本来确定模型预测方向,提升学习性能,既避免了无监督学习精度不足的问题,又克服了有监督过程标签匮乏的缺陷,在充斥着海量无标签数据的工业大数据时代,前景广阔。2、ssl在软测量领域的应用尚处于起步阶段,取得一定效果的同时也存在若干问题:(1)现有的半监督学习,如s3vm、tsvm等,多为浅层结构,在敏感特征挖掘及复杂映射学习方面存在先天不足,不适合复杂化工过程建模。为弥补单体学习器的不足,又提出了co-training、tri-training等多模型集成学习方法,但也存在着独立视图难以划分、模型结构过于复杂等问题;(2)存在少量的半监督深度模型,如深度置信网络(deep beliefnetwork,dbn)、深度玻尔兹曼机(deep boltzmann machine,dbm)等,但大多采取“先无监督训练,再有监督微调”的割裂式组合策略,并非真正意义上的半监督学习;(3)现有软测量多为静态模型,假定任一时刻的主导变量只与该时刻的关联变量相关。但化工生产是一动态时变过程,不同时刻数据之间存在潜在关联,即当前的质量指标不仅与操作变量的当前设定相关,还受到其历史信息的影响。静态模型对动态时序特征的捕捉不够灵敏,模型精度低、鲁棒性差,且普遍缺少自适应更新及修正机制。技术实现思路1、本发明实施例的目的是提供一种基于半监督卷积阶梯网络的化工装置软测量方法、装置及设备,以解决现有技术中的当前软测量模型存在的浅层、静态、有标签样本匮乏等问题。2、为了实现上述目的,本发明的第一方面提供了一种基于半监督卷积阶梯网络的化工装置软测量方法,所述方法包括:从装置分布式控制系统中获取与主导变量关联的若干关联变量的当前时刻的实时数据;从历史数据库中获取关联变量的与所述当前时刻存在时滞步长关系的历史数据;将所述实时数据和历史数据进行拼接并预处理后得到模型输入数据;将所述模型输入数据输入训练后的基于半监督卷积阶梯网络的软测量模型的无噪编码通道,所述软测量模型包括加噪编码通道、无噪编码通道和解码通道;所述加噪编码通道与所述解码通道侧向相连,所述无噪编码通道与所述加噪编码通道权值共享;以所述软测量模型的输出值作为所述主导变量的预测值。3、优选地,所述训练后的基于半监督卷积阶梯网络的软测量模型通过以下步骤得到:从实验室信息管理系统中获取主导变量的历史数据;从装置分布式控制系统中获取关联变量的历史数据,并对所述历史数据进行预处理;运用特征选择或数据压缩算法,确定关联变量和时滞步长,得到用于软测量模型训练的时滞样本集;将所述时滞样本集按照比例划分为训练集和测试集;所述训练集包括有标签样本和无标签样本,测试集只包括有标签样本;计算训练集内有标签及无标签样本各自的数量,复制有标签样本,使其与无标签样本数量一致;通过所述有标签样本和无标签样本对所述基于半监督卷积阶梯网络的软测量模型进行训练,得到所述训练后的基于半监督卷积阶梯网络的软测量模型。4、优选地,所述有标签样本是指该样本内既包含关联变量又包含与之对应的主导变量;所述无标签样本是指该样本内只包含关联变量而缺少相应的主导变量;所述有标签样本的标签与包含的主导变量相关。5、优选地,通过所述有标签样本和无标签样本对所述基于半监督卷积阶梯网络的软测量模型进行训练,包括:设计基于半监督卷积阶梯网络的软测量模型的网络结构,设置所述软测量模型的超参数并初始化模型;在加噪编码通道和无噪编码通道内同时输入一批次的有标签样本和一批次的无标签数据,开始训练;通过迭代训练,以损失函数最小化为目标,训练后得到经过训练的软测量模型;将测试集中的样本输入所述经过训练的软测量模型的无噪编码通道,输出预测结果,与样本标签比对并计算软测量准确率;若精度满足预设要求,则以所述经过训练的软测量模型作为所述训练后的基于半监督卷积阶梯网络的软测量模型,并进行在线部署;否则调整所述软测量模型的参数,重新进行训练。6、优选地,所述预处理包括:对数据进行无效样本删除、离群点清洗和数据修正中的至少一者,以及数据归一化。7、优选地,所述用于软测量模型训练的时滞样本集中的时滞样本包括输入关联变量维度乘以时滞步长长度个输入和1个输出。8、优选地,所述软测量模型采用复合损失函数,所述复合损失函数包括有监督部分和无监督两部分。9、优选地,所述方法还包括:基于工艺要求和操作规范,设定软测量的相对误差阈值;根据实验室信息管理系统的化验周期,获取当前周期的主导变量的分析值,并同步计算所述软测量模型的主导变量的预测值;计算主导变量的分析值和预测值的相对误差;若计算出的相对误差大于所述相对误差阈值,对所述软测量模型进行校正。10、优选地,对所述软测量模型进行校正,包括:沿时间轴的反方向,获取与当前时刻最接近的多个有标签样本和多个无标签样本,对已有软测量模型的参数进行再训练和微调;在每次训练和微调后重新获取主导变量的分析值和预测值,并计算相对误差,直至计算出的相对误差小于所述相对误差阈值。11、在本发明的第二方面,还提供了一种基于半监督卷积阶梯网络的化工装置软测量装置,所述装置包括:实时数据获取模块,用于从装置分布式控制系统中获取与主导变量关联的若干关联变量的当前时刻的实时数据;历史数据获取模块,用于从历史数据库中获取关联变量的与所述当前时刻存在时滞步长关系的历史数据;输入生成模块,用于将所述实时数据和历史数据进行拼接并预处理后得到模型输入数据;预测模型模块,用于将所述模型输入数据输入训练后的基于半监督卷积阶梯网络的软测量模型的无噪编码通道,所述软测量模型包括加噪编码通道、无噪编码通道和解码通道;所述加噪编码通道与所述解码通道侧向相连,所述无噪编码通道与所述加噪编码通道权值共享;以及输出生成模块,用于以所述软测量模型的输出值作为所述主导变量的预测值。12、优选地,所述训练后的基于半监督卷积阶梯网络的软测量模型通过以下步骤得到:从实验室信息管理系统中获取主导变量的历史数据;从装置分布式控制系统中获取关联变量的历史数据,并对所述历史数据进行预处理;运用特征选择或数据压缩算法,确定关联变量和时滞步长,得到用于软测量模型训练的时滞样本集;将所述时滞样本集按照比例划分为训练集和测试集;所述训练集包括有标签样本和无标签样本,测试集只包括有标签样本;计算训练集内有标签及无标签样本各自的数量,复制有标签样本,使其与无标签样本数量一致;通过所述有标签样本和无标签样本对所述基于半监督卷积阶梯网络的软测量模型进行训练,得到所述训练后的基于半监督卷积阶梯网络的软测量模型。13、优选地,所述有标签样本是指该样本内既包含关联变量又包含与之对应的主导变量;所述无标签样本是指该样本内只包含关联变量而缺少相应的主导变量;所述有标签样本的标签与包含的主导变量相关。14、优选地,通过所述有标签样本和无标签样本对所述基于半监督卷积阶梯网络的软测量模型进行训练,包括:设计基于半监督卷积阶梯网络的软测量模型的网络结构,设置所述软测量模型的超参数并初始化模型;在加噪编码通道和无噪编码通道内同时输入一批次的有标签样本和一批次的无标签数据,开始训练;通过迭代训练,以损失函数最小化为目标,训练后得到经过训练的软测量模型;将测试集中的样本输入所述经过训练的软测量模型的无噪编码通道,输出预测结果,与样本标签比对并计算软测量准确率;若精度满足预设要求,则以所述经过训练的软测量模型作为所述训练后的基于半监督卷积阶梯网络的软测量模型,并进行在线部署;否则调整所述软测量模型的参数,重新进行训练。15、优选地,所述预处理包括:对数据进行无效样本删除、离群点清洗和数据修正中的至少一者,以及数据归一化。16、优选地,所述用于软测量模型训练的时滞样本集中的时滞样本包括输入关联变量维度乘以时滞步长长度个输入和1个输出。17、优选地,所述软测量模型采用复合损失函数,所述复合损失函数包括有监督部分和无监督两部分。18、优选地,所述装置还包括:基于工艺要求和操作规范,设定软测量的相对误差阈值;根据实验室信息管理系统的化验周期,获取当前周期的主导变量的分析值,并同步计算所述软测量模型的主导变量的预测值;计算主导变量的分析值和预测值的相对误差;若计算出的相对误差大于所述相对误差阈值,对所述软测量模型进行校正。19、优选地,对所述软测量模型进行校正,包括:沿时间轴的反方向,获取与当前时刻最接近的多个有标签样本和多个无标签样本,对已有软测量模型的参数进行再训练和微调;在每次训练和微调后重新获取主导变量的分析值和预测值,并计算相对误差,直至计算出的相对误差小于所述相对误差阈值。20、在本发明的第三方面,还提供了一种基于半监督卷积阶梯网络的化工装置软测量设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述的基于半监督卷积阶梯网络的化工装置软测量方法的步骤。21、在本发明的第四方面,还提供了一种计算机可读存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行前述的基于半监督卷积阶梯网络的化工装置软测量方法的步骤。22、本发明的第五方面提供一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现前述的基于半监督卷积阶梯网络的化工装置软测量方法。23、上述技术方案至少具有以下有益效果:24、(1)本发明提出半监督学习的软测量模型,克服传统有监督模型只能利用有标签样本的不足,既能从无标签样本中捕获潜在数据结构,又能从有标签样本中提取趋势性特征,充分利用所有可获取数据,适用性和实用性更强。25、(2)本发明提出sscln模型,能同步处理有/无标签样本,通过复合损失函数同步开展有/无监督学习,且通过特别设计的权重系数,平衡两个学习过程,提升特征质量和预测精度。26、(3)本发明提出的sscln,将传统的全连接神经层替换为卷积-反卷积、池化-反池化处理层,搭配时滞化预处理技术,赋予模型二维样本处理和动态时序建模能力。27、(4)本发明提出的sscln,在加噪编码通道内通过逐层添加高斯噪声的方式,增强模型的鲁棒性,挖掘本质化特征。因此sscln对现场噪声的抗性更强,更适应现场的低质量数据。28、本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。