医疗专利数据库

一种基于机器学习的含能材料热分解温度预测方

发布日期:2024-08-22 浏览次数:

本发明属于含能材料热分解温度预测,特别涉及一种基于相关分析建立自定义描述符集并利用机器学习模型预测含能材料热分解温度的方法。背景技术:1、含能材料是能快速释放出能量的特殊材料,在火炸药、推进剂、烟火药剂等领域得到广泛应用,其被认为是国防安全领域的重要的基石。热分解温度(temperaturedecomposition,tdec)是评价含能材料热稳定性的重要指标,热分解温度越高代表含能材料的热稳定性越好。目前在武器装备和深井钻探等领域要求含能材料具有很高的热分解温度。含能材料热分解温度测试实验具有复杂性,因此,对含能材料热的分解温度进行准确、快速的预测,对新型含能材料的设计、合成及应用具有重要意义。2、计算机数值模拟在含能材料众多性能的预测方面得到了应用,但基于分子动力学(molecular dynamics,md)和密度泛函理论(density functional theory,dft)等原理的数值模拟需要消耗大量的计算资源和时间。作为一种数据驱动的计算方法,机器学习具有适应性强、泛化性好、计算效率高等优势,它可以通过学习现有数据的规律,实现对新数据的预测和分类等任务,机器学习预测已经成为含能材料性能预测领域的主流方法之一。然而,目前关于机器学习预测含能材料热分解温度的研究存在预测精度较低的问题,许多研究的预测模型在测试集上的误差平均值(mae)大于20℃。3、含能材料的热分解过程是一个复杂的过程,吸热前后的温度变化和分解点的能量释放伴随着多种物理状态变化和化学反应,包含了许多的非线性的变化过程。仅仅基于传统的单一分子特征提取方法建立的特征参数集进行机器学习预测模型的训练,很难实现对热分解温度的高精度预测。所以,需要新的分子特征参数集构建方法和新的机器学习方法,以提高模型预测的精度。技术实现思路1、针对现有的含能材料热分解温度预测方法的精度不高、特征提取方法的可解释性不强的问题,本发明的主要目的是提出一种基于机器学习的含能材料热分解温度的预测方法,构建含能材料分子结构信息与热分解温度数据集;基于相关分析选取与热分解温度具有强相关性的描述符,并由这些描述符组成自定义描述符集;基于由自定义描述符集提取的分子特征参数集和热分解温度数据集构建机器学习模型,实现含能材料热分解温度的预测。本发明具有预测精度高、效率高的特点。2、本发明的目的通过以下技术方案实现。3、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,收集并筛选含能材料分子结构信息和热分解温度构建数据集。对含能材料分子的结构进行特征提取,采用相关分析的方法计算描述符与热分解温度之间的相关性,选取与热分解温度具有强相关性的描述符构建自定义描述符集,再基于自定义描述符集对分子结构进行特征提取,并由特征提取的参数构建分子特征参数集。构建支持向量机算法的机器学习模型,以分子特征参数集作为模型输入,热分解温度数据集作为机器学习模型输出,训练机器学习模型。以分子特征参数作为输入,根据训练好的机器学习模型实现对含能材料热分解温度的预测。4、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,包括以下步骤:5、步骤1,检索文献,读取dsc实验曲线的峰值或文章中明确给出的热分解温度数据,收集只包含c、h、o、n四种元素的含能化合物,去除含离子化合物、共晶或溶剂化物的数据。将分子结构信息以smiles码形式储存,构建含能材料分子结构信息与热分解温度的数据集。6、步骤2,使用rdkit计算分子的众多描述符,采用皮尔森相关性分析方法对分子描述符与热分解温度一起进行相关分析,式(1)为皮尔森相关性系数的计算方法。7、8、根据相关分析结果,提取与热分解温度的相关系数r在区间[-1,-0.4]∪[0.4,1]之内的描述符,构建自定义描述符集,即实现基于含能材料分子结构的特征提取。9、作为优选,表1为自定义描述符集中的部分描述符,这些描述符与含能材料热分解温度相关性满足预设强相关要求。10、表1自定义描述符集中的部分描述符11、12、步骤3,基于步骤2中提取的描述符构建分子特征参数集,建立一个m×n的矩阵,如式(2)所示,m为含能材料分子的总数,n为步骤2中自定义描述符集中描述符的数量,aij为第i个分子的第j个描述符对应的数值。13、14、将分子特征参数集以二维数组的数据结构保存,二维数组的每一行为不同分子对应的所有描述符的参数数值,二维数组的每一列为每一种描述符对应的所有分子的参数数值。在特征参数集标准化时,以二维数组的每一列为基本单位进行数据标准化。15、16、标准化方法依照式(3)的计算方法,其中vstad表示标准化后的数值,v表示标准化前的数值,vmax表示这一列数值的最大值,vmin表示这一列数值的最小值。17、步骤4,机器学习模型的建立:根据步骤3中分子特征参数集的维度设置输入层的维度建立基于支持向量机算法的机器学习模型,对于m×n的矩阵,n为机器学习模型的输入维度。n×m阶矩阵x为机器学习模型输入,即根据式(4)计算热分解温度值,其中x=at,a为步骤3中数据标准化后的特征参数矩阵。18、f(x)=[w1 w2 … wn]x+b        (4)19、通过式(5)确定权重矩阵w=[w1 w2 … wn]中每个元素的值,f(xi)为模型输出的预测值,yi为热分解温度的真实值。式(6)为∈-不敏感损失(∈-insensitive loss)函数。对于不同的预测模型可以设置不同的不敏感度∈的值。在含能材料热分解温度的测试中,10℃的误差对实验研究的影响非常小,所以在本发明的含能材料热分解温度预测中设置不敏感度∈的值为10。20、21、22、步骤5,机器学习模型的训练和测试:设置不同的正则化常数c的值和学习率的值对机器学习模型进行训练。在测试集上以决定系数r2、误差平均值mae、方均根误差rmse、正确率accuracy这四个指标,根据这四个指标评价机器学习模型的预测精度。保存预测精度最高的模型参数值,并保存训练好的机器学习模型。23、步骤6,以分子特征参数作为输入,根据训练好的机器学习模型实现对含能材料热分解温度的预测。24、有益效果:25、1、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,采用皮尔森相关性的分析方法对含能材料分子描述符与热分解温度进行相关分析,选取与热分解温度具有较强相关性的描述符构建自定义描述符集,该自定义描述符集对热分解温度预测的可解释性更强,进而提高对热分解温度预测的精度。26、2、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,基于相关分析获得的自定义描述符集,对分子的结构进行特征提取,构建分子特征参数集;利用所述分子特征参数集训练机器学习模型,提高机器学习模型对热分解温度预测的精度。27、3、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,采用支持向量机的机器学习模型,为模型中的∈-不敏感损失函数设置合适的裕度,使模型更不容易受到数据异常值的影响,提高模型训练的效率和稳定性,实现对含能材料热分解温度准确、高效的预测。28、4、本发明公开的一种基于机器学习的含能材料热分解温度预测方法,鉴于含能材料热分解温度试验成本高和存在安全风险的特性,通过针对性地检索文献,读取dsc实验曲线的峰值或文章中明确给出的热分解温度数据,收集只包含c、h、o、n四种元素的含能化合物,去除含离子化合物、共晶或溶剂化物的数据,将分子结构信息以smiles码形式储存,构建含能材料分子结构信息与热分解温度的数据集。本发明构建数据集的方法能够丰富数据来源、精准收集用于含能材料热分解温度预测的数据,节省试验成本,化解安全风险。