一种肝癌风险预测模型的构建方法与流程
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及模型构建,特别涉及一种肝癌风险预测模型的构建方法。、肝癌恶性程度高,起病隐匿,病程短,预后较差,死亡率接近发病率,是最常见的恶性肿瘤之一,不仅严重危害人类健康,且带来较严重的社会经济负担。、%的肝癌病例是可以预防的,均因暴露于一些可改变的危险因素而增加了肝癌的发病几率,例如肥胖、... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及模型构建,特别涉及一种肝癌风险预测模型的构建方法。背景技术:1、肝癌恶性程度高,起病隐匿,病程短,预后较差,死亡率接近发病率,是最常见的恶性肿瘤之一,不仅严重危害人类健康,且带来较严重的社会经济负担。2、75%的肝癌病例是可以预防的,均因暴露于一些可改变的危险因素而增加了肝癌的发病几率,例如肥胖、饮酒、吸烟、代谢性疾病、黄曲霉毒素污染、hbv和hcv感染等。因此,肝癌与危险因素之间的关联有重要研究意义。当前随着社会经济的发展和人民生活水平的提高,生活方式行为也在发生改变,所存在的疾病的危险因素也是不同的。3、肝癌危险因素的复杂多样对于肝癌的一级预防带来较大挑战,确定肝癌高危人群,进行分层筛查与监测是提高肝癌筛查的有效措施,建立肝癌高危人群风险预测模型有助于准确识别肝癌高危人群。目前只常见一些肝癌筛查方式,不能对肝癌进行很好的预测。4、因此,本发明提出一种肝癌风险预测模型的构建方法。技术实现思路1、本发明提供一种肝癌风险预测模型的构建方法,用以通过建立患者基础信息与治疗基础信息之间的关联关系,提供合理且可靠的模型构建信息,且后续通过构建向量、测试以及评价优化,方便对模型进行精度优化,提高预测准确性,且进一步便利了对肝癌的有效预测。2、本发明提供一种肝癌风险预测模型的构建方法,包括:3、步骤1:获取不同肝癌患者在不同治疗阶段的患者基础信息以及治疗基础信息;4、步骤2:建立同个肝癌患者在不同治疗阶段基于所述患者基础信息与治疗基础信息所对应的危险因素指标之间的关联关系;5、步骤3:提取同类型肝癌所对应的所有可能阶段以及每个可能阶段下的所有关联关系,且结合可能阶段的先后治疗顺序,构建得到若干危险-治疗向量;6、步骤4:根据所有风险-治疗向量,构建得到初始预测模型,并基于测试样本进行测试,且结合模型评价指标进行评价优化,得到风险预测模型。7、优选的,获取不同肝癌患者在不同治疗阶段的患者基础信息以及治疗基础信息,包括:8、确定预先锁定的不同数据来源的来源权威性;9、根据所述来源权威性对相应数据来源的来源数据进行预设筛选;10、根据筛选结果对每个肝癌患者的所有信息进行整合,并对每个肝癌患者的整合信息进行重复剔除,得到对应肝癌患者基于不同治疗阶段的患者基础信息以及治疗基础信息。11、优选的,建立同个肝癌患者在不同治疗阶段基于所述患者基础信息与治疗基础信息所对应的危险因素指标之间的关联关系,包括:12、将同个肝癌患者在每个治疗阶段的患者基础信息中的每个第一描述与治疗基础信息中每个第二描述进行映射,得到每个第一描述的第一参与值;13、14、其中,c1表示对应治疗阶段中第一描述的第一参与值;n1表示对应治疗阶段中存在的第二描述的总个数;x(x1,x2i1)表示对应治疗阶段下的对应第一描述x1与第i1个第二描述x2i1之间的描述衔接函数;表示除x(x1,x2i1)之外的剩余所有描述衔接函数对应的衔接方差;δ1表示对应治疗阶段的衔接绝对偏差;15、从治疗基础信息中提取不同治疗指标,并根据每个治疗指标涉及到的所有治疗描述,确定对应治疗指标的指标权重,并向每个基础指标赋予基础权重;16、17、其中,j(x3j1,j2)表示对第j2个治疗指标涉及到的j1个治疗描述x3j1,j2进行描述解析的函数,且取值范围为(0,1);z(j(x3j1,j2))表示对x3j1,j2的描述解析结果的重要反馈函数,且取值范围为(0,1);m1表示第j2个治疗指标涉及到的治疗描述的个数;m2表示提取到的治疗指标的个数;qzj2表示第j2治疗指标的指标权重;18、根据指标权重以及基础权重,从对应治疗阶段中的所有基础指标以及治疗指标中锁定危险因素指标;19、对所述第一参与值进行由大到小的排序,并分别获取大于等于预设参与值之前的值基于治疗基础信息的全部匹配描述,构建得到第一匹配序列,同时,分别获取小于预设参与值之后的值基于治疗基础信息的最匹配描述以及第二最匹配描述,构建得到第二匹配序列;20、基于每个危险因素指标确定第一匹配序列的第一危险值以及第二匹配序列的第二危险值,并分别构建基于每个危险因素指标的危险序列;21、基于所述危险序列设置基于所对应危险因素指标之间的关联标签。22、优选的,向每个基础指标赋予基础权重,包括:23、24、其中,u0表示基于m11下的每个第一描述下的最大描述衔接值所对应的第二描述集合,确定与对应基础指标匹配的治疗指标的个数;qzj3表示基于u0下的第j3个治疗指标的指标权重;qzs表示所有qzj2的累加和;m11表示第j4个基础指标所涉及到的第一描述的个数;qjj4表示第j4个基础指标的基础权重;m12表示对应治疗阶段下第一描述的总个数;nj3表示基于m11下的第一描述所匹配第j3个治疗指标的设定匹配描述个数与实际匹配描述个数的个数差;(εj3)min表示从第j3个治疗指标所对应的差异-描述-衰减映射表中匹配得到的所有衰减因子中的最小衰减因子。25、优选的,基于每个危险因素指标确定第一匹配序列的第一危险值以及第二匹配序列的第二危险值,包括:26、分别确定所述第一匹配序列中对应危险因素指标的序列出现总次数zx、单独序列的总个数zg以及每个重叠序列的总个数zc以及每个重叠序列的出现次数zcg;27、计算每个危险因素指标的第一危险值:28、29、其中,zcgj5表示与对应危险因素指标匹配的第j5个重叠序列的出现次数;qavej5表示与对应危险因素指标匹配的第j5个重叠序列存在对应关系的所有指标权重的平均权重;qj5,max表示与对应危险因素指标匹配的第j5个重叠序列存在对应关系的所有指标权重中的最大权重;q1表示对应危险因素因素指标的权重;d1表示对应第一危险值;30、计算每个危险因素指标的第二危险值:31、32、其中,p01表示对应第二匹配序列中第一个序列与对应危险因素指标的匹配系数,取值为0或1;p02表示对应第二匹配序列中第二个序列与对应危险因素指标的匹配系数,取值为0或1;d2为对应的第二危险值。33、优选的,提取同类型肝癌所对应的所有可能阶段以及每个可能阶段下的所有关联关系,包括:34、对不同肝癌患者的不同治疗阶段按照肝癌类型进行划分,得到同类型肝癌下的所有可能阶段;35、将确定的所有关联关系按照可能阶段进行提取,得到对应可能阶段下的所有关联关系。36、优选的,结合可能阶段的先后治疗顺序,构建得到若干危险-治疗向量,构建得到初始预测模型,包括:37、向不同肝癌类型的可能阶段赋予治疗先后顺序,得到若干串行疗程;38、基于每个串行疗程下涉及到的先后阶段的所有关联关系,构建得到危险-治疗向量;39、将所述危险-治疗向量依次输入到神经网络模型,训练得到初始预测模型。40、优选的,基于测试样本进行测试,结合模型评价指标进行评价优化,得到风险预测模型,包括:41、获取与肝癌相关的测试样本,并输入到所述初始预测模型中,获取得到测试结果;42、基于模型评价指标对测试结果进行评价,确定改进方向;43、获取与所述改进方向匹配的改进向量,对所述初始预测模型进行优化,得到风险预测模型。44、与现有技术相比本技术的有益效果如下:45、通过建立患者基础信息与治疗基础信息之间的关联关系,提供合理且可靠的模型构建信息,且后续通过构建向量、测试以及评价优化,方便对模型进行精度优化,提高预测准确性,且进一步便利了对肝癌的有效预测。46、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。47、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。