基于多相关度融合的复材特征提取方法及应用
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及数据处理,具体涉及一种基于多相关度融合的复材特征提取方法及应用。、利用试验大数据进行复合材料力学性能预测对于减少复合材料试验规模、降低成本、缩短研制周期具有重要意义,而复合材料性能预测和分析的有效性取决于特征的选取。国内外特征选取的典型方法为计算相关度,按相关度由高到低进行筛选。... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及数据处理,具体涉及一种基于多相关度融合的复材特征提取方法及应用。背景技术:1、利用试验大数据进行复合材料力学性能预测对于减少复合材料试验规模、降低成本、缩短研制周期具有重要意义,而复合材料性能预测和分析的有效性取决于特征的选取。国内外特征选取的典型方法为计算相关度,按相关度由高到低进行筛选。近年来各种相关度评估方法层出不穷,pearson相关系数法用于衡量两个变量之间的线性相关性强弱,在统计分析、机器学习和数据挖掘等领域有着重要的应用;spearman相关系数用于衡量两个变量之间单调相关性的强弱,解决了皮尔逊相关分析法线性变量的局限,在决策问题、特征选择领域应用广泛。这些方法的应用和发展,为复合材料性能与关联参数分析提供了基本的研究途径。然而,每种相关系数评估法都有一定的使用前提和适用场景,chandrasegar t等人指出,pearson相关系数分析法常用于相关评估两个连续变量之间的线性关系,spearman相关系数分析法是基于每个变量的排序值,而不是原始数据,故常用于评价涉及有序变量的关系(analysing the concrete compressive strength using pearson andspearman.international conference of electronics[j].communication andaerospace technology,2017,2:215-218.);edwin等人指出pearson相关系数可以很好地评估变量的线性关系,而spearman相关系数评估变量的单调关系效果好,现有技术指出对于满足正态连续分布,线性关系的无序变量来说,可选择皮尔逊相关系数分析法,不建议仅使用斯皮尔曼相关系数来衡量两个变量之间关联强度的重要指标。2、目前国内外对于相关度的评估方法使用较为单一,表现为所有数据集仅使用一种相关系数评估方法,并未考虑不同评估方法具有不同使用前提;而复合材料特征数据集具有维度大、分布形式多样、特征之间关系复杂和数据集具有低秩性的特点,若所有特征仅采用一种相关系数法,不能保证特征筛选的准确性,进而影响复材性能预测模型的精度。3、因此,需要提供一种基于多相关度融合的复材特征提取方法及应用以解决上述问题。技术实现思路1、本发明提供一种基于多相关度融合的复材特征提取方法及应用,以解决现有的对于相关度的评估方法使用较为单一,表现为所有数据集仅使用一种相关系数评估方法,并未考虑不同评估方法具有不同使用前提;而复合材料特征数据集具有维度大、分布形式多样、特征之间关系复杂和数据集具有低秩性的特点,若所有特征仅采用一种相关系数法,不能保证特征筛选的准确性,进而影响复材性能预测模型的精度的问题。2、本发明的一种基于多相关度融合的复材特征提取方法采用如下技术方案,包括:3、获取反映复材的材料力学性能的力学性能参数以及影响复材力学性能的特征参数;根据复材的每种力学性能参数与每个特征参数对应关系,获取每种力学性能参数对应的多组数据集;其中,复材的特征参数包括:材料参数及与力学性能参数关联的力学参数;4、对每组数据集中的每个参数进行正态分布检验,并对每组数据集中的两个参数之间进行线性关系检验,得到符合正态分布且线性相关的目标组数据集,以及不符合正态分布或者非线性相关的目标组数据集;5、基于pearson相关系数法获取符合正态分布且线性相关的目标组数据集中的力学参数与特征参数的相关系数;基于spearman相关系数法获取不符合正态分布或者非线性相关的目标组数据集的相关系数;6、获取目标组数据集中相关系数的绝对值满足预设的相关系数绝对值阈值的相关目标组数据集;根据多组数据集的样本量获取数据集的最大特征维度值;7、按照相关目标组数据集对应的相关系数的绝对值大小,从相关目标组数据集中挑选出最大特征维度值数量的相关目标组样本数作为最终数据集,将最终数据集中的特征参数作为复材的每种力学性能参数对应的最终特征参数。8、优选地,获取每种力学性能参数对应的多组数据集的步骤为:9、以材料参数和单向板拉伸性能参数作为基准特征参数;10、基于基准参数进行特征层的层递进预测,以确定每个力学性能参数对应的目标特征参数;11、将每个目标特征参数与对应的力学性能参数作为一组数据集,得到每种力学性能参数对应的多组数据集。12、优选地,力学性能参数包括单向板拉伸性能参数、单向板压缩性能参数、单向板剪切性能参数以及复合板力学性能参数。13、优选地,与力学性能参数关联的力学参数包括:14、与单向板拉伸性能参数关联的力学参数为:0°拉伸强度、0°拉伸模量、0°拉伸破坏应变、90°拉伸强度、90°拉伸模量、单向板泊松比;15、与单向板压缩性能参数关联的力学参数为:0°压缩强度、0°压缩模量、0°压缩破坏应变、90°压缩强度、90°压缩模量;16、与单向板剪切性能参数关联的力学参数为:纵横剪切强度、纵横剪切模量;17、与复合板力学性能参数关联的力学参数为:无缺口拉伸强度、无缺口压缩强度。18、优选地,材料参数包括:19、材料属性参数,其包括树脂含量、纤维体积含量、纤维单位面积重量;20、材料结构参数,其包括:铺层角度、层数;21、以及材料工艺参数,其包括:挥发份含量、孔隙率、树脂流动度、凝胶时间、固化层板密度、固化单层厚度。22、优选地,利用kolmogorov-smirnov-lillietest检验法对每组数据集中的特征参数与力学性能参数分别进行正态分布检验;采用最小二乘法对每组数据集中的特征参数与力学性能参数之间进行线性关系检验。23、优选地,获取目标组数据集的相关系数满足预设的相关系数绝对值阈值的相关目标组数据集的步骤为:24、将绝对值大于或者等于相关系数绝对值阈值的相关系数作为目标相关系数;25、将每个目标相关系数对应的目标组数据集作为相关目标组数据集。26、优选地,根据多组数据集的样本量获取数据集的最大特征维度的步骤为:27、28、式中,b表示多组数据集的样本量;29、a表示数据集的最大特征维度。30、优选地,按照相关目标组数据集对应的相关系数的绝对值大小,从相关目标组数据集中挑选出最大特征维度数量的相关目标组样本数作为最终数据集的步骤为:31、按照相关目标组数据集对应的相关系数的绝对值从大到小,对相关目标组数据集进行排序得到数据序列;32、按照数据序列中的顺序,从数据序列中选取最大特征维度值数量的相关目标组数据集作为最终数据集。33、一种基于多相关度融合的复材特征提取在复材力学性能参数预测的应用,包括:基于本发明公开的基于多相关度融合的复材特征提取方法,提取的力学性能参数对应的最终特征参数;构建机器学习模型,将最终特征参数作为机器学习模型的输入,对应的力学性能参数作为机器学习模型的输出对神经网络训练,得到训练好的机器学习模型;基于本发明公开的基于多相关度融合的复材特征提取方法提取当前复材的最终特征参数,并将当前复材的最终特征参数输入训练好的机器学习模型进行当前复材的力学性能参数的预测。34、本发明的有益效果是:35、本发明在获取复合材料数据集的基础上,进行复合材料预测目标与特征之间的相关度计算,考虑到关联度越高的特征与目标关系越密切,对目标预测贡献度越高,而机器学习模型的构建过程中,特征维度过大会引起维度爆炸,大大降低模型拟合精度;故本发明结合相关度、数据量制定特征筛选原则,即根据设定的相关度阈值获取相关目标组数据集,根据最大特征维度值从排序后的相关目标组数据集中筛选出具有高关联度的特征的最终数据集,从而提取最终特征参数,实现了特征参数的降维,为复材性能预测提供了精度保障。