一种基于甲基化位点的前列腺癌相关数据分析系_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种基于甲基化位点的前列腺癌相关数据分析系

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种基于甲基化位点的前列腺癌相关数据分析系
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本说明书涉及生物,特别涉及一种基于甲基化位点的前列腺癌相关数据分析系统和方法。、随着人口老龄化的加剧、生活方式与饮食结构的改变,国内前列腺癌发病率近年来呈现了明显上升趋势,现已成为中国男性第五大常见癌症。早期前列腺癌无任何临床症状,因此多数患者确诊时病程已处于中晚期,治愈希望较小。目前,血...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本说明书涉及生物,特别涉及一种基于甲基化位点的前列腺癌相关数据分析系统和方法。背景技术:1、随着人口老龄化的加剧、生活方式与饮食结构的改变,国内前列腺癌发病率近年来呈现了明显上升趋势,现已成为中国男性第五大常见癌症。早期前列腺癌无任何临床症状,因此多数患者确诊时病程已处于中晚期,治愈希望较小。目前,血清前列腺特异性抗原(prostate specific antigen,psa)检测是临床上对前列腺癌进行筛查的金标准。psa检测通常用于指导是否进行深度临床检验,例如在psa检测结果异常的情况下,使用影像学检查发现可疑病灶,以及使用活体组织检查明确病理性质。但psa检测存在假阳性过多的问题。在psa检测结果异常的被测者中,有相当大比例的人在活检中未被确诊前列腺癌。psa检测出现假阳性结果导致的过度诊断,使得受试者承担了不必要的生理、心理以及经济负担。同时,也增加了医生的工作难度,降低了医生的工作效率。2、因此,有必要提供一种基于甲基化位点的前列腺癌相关数据分析系统和方法,能够准确地确定受试者的分型,从而实现前列腺癌早期筛查,减轻医生的工作难度,提升医生的工作效率。技术实现思路1、本说明书实施例之一提供一种基于甲基化位点的前列腺癌相关数据分析系统。所述系统包括:数据分析模块,被配置为:基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,所述分型预测模型为机器学习模型;基于所述初始分型,确定预测分型信息。2、在一些实施例中,所述前列腺癌相关数据包括所述受试者的dna样本的原始测序数据经过数据处理后的数据,所述原始测序数据包括甲基化数据和测序深度数据的至少一种,所述甲基化数据包括甲基化位点的甲基化比例。3、在一些实施例中,所述分型预测模型至少包括第一模型、第二模型、第三模型和第四模型中的两个,所述前列腺癌相关数据至少包括第一相关数据、第二相关数据、第三相关数据和第四相关数据中的两个,所述初始分型至少包括第一初始分型、第二初始分型、第三初始分型和第四初始分型中的两个;所述基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,包括:基于第一相关数据,通过所述第一模型,预测所述第一初始分型,所述第一模型为支持向量机分类模型,所述第一相关数据为所述甲基化数据经过第一预处理后的数据;和/或基于第二相关数据,通过所述第二模型,预测所述第二初始分型,所述第二模型为支持向量机分类模型,所述第二相关数据为所述第一相关数据经所述测序深度数据校正后的数据;和/或基于第三相关数据,通过所述第三模型,预测所述第三初始分型,所述第三模型包括支持向量机分类模型,所述第三相关数据为所述甲基化数据经过第二预处理后的数据;和/或基于第四相关数据,通过所述第四模型,预测所述第四初始分型,所述第四模型包括支持向量机分类模型,所述第四相关数据为所述第三相关数据经所述测序深度数据校正后的数据。4、在一些实施例中,所述第一预处理包括:去除所述甲基化数据中的异常值;对含空缺值的所述甲基化数据进行填充,得到填充数据集。5、在一些实施例中,所述第二预处理包括:去除所述甲基化数据中的异常值;对不含空缺值的所述甲基化数据降维聚类分析,得到聚类数据集;对含空缺值的所述甲基化数据进行填充,得到填充数据集;合并所述聚类数据集和所述填充数据集的数据,对合并的数据进行降维聚类分析。6、在一些实施例中,所述基于所述初始分型,确定预测分型信息,包括:基于所述第一初始分型、所述第二初始分型、所述第三初始分型和/或所述第四初始分型,以及投票规则,确定中间分型信息,中间分型信息包括前列腺癌分型、非前列腺癌分型、无法判断;响应于中间分型信息为前列腺癌分型或非前列腺癌分型,通过数据后处理,确定预测分型信息。7、在一些实施例中,所述投票规则基于所述甲基化位点的个数确定。8、在一些实施例中,所述系统还包括训练模块,所述训练模块被配置为:基于训练样本,迭代优化初始第一模型、初始第二模型、初始第三模型和/或初始第四模型的参数,所述训练样本包括正样本和负样本;响应于预测准确性和预测一致性满足第一预设条件,获取训练好的所述第一模型、所述第二模型、所述第三模型和/或所述第四模型;所述第一预设条件包括所述预测准确性不小于准确性阈值,并且所述预测一致性不小于一致性阈值。9、在一些实施例中,所述训练模块被进一步配置为:基于第一样本数据,训练所述初始第一模型,所述第一样本数据为经过第一预处理的历史甲基化数据;基于第二样本数据,训练所述初始第二模型,所述第二样本数据为经历史测序深度数据校正后的第一样本数据;基于第三样本数据,训练所述初始第三模型,所述第三样本数据为经过第二预处理的历史甲基化数据;和/或基于第四样本数据,训练所述初始第四模型,所述第四样本数据为经历史测序深度数据校正后的第三样本数据。10、在一些实施例中,所述甲基化位点包括igfbp3_36,pou4f2_37,mir663a_50,mir663a_37,znf154_73,mir663a_55,mir663a_61,igfbp3_44,igfbp3_40,znf154_53,pou4f2_74,mir663a_21,mir663a_104,fezf2_31,fezf2_58,mir663a_42,serpinb1_36,mir663a_90,fezf2_21,mir663a_86,fhad1_57,igfbp3_83,igfbp3_36,pou4f2_9,znf154_73,serpinb1_51,fezf2_48,apc_45,igfbp3_63,sox1-ot_89,apc_110,pou4f2_48,apc_78,igfbp3_40,fezf2_31,mir663a_77,igfbp3_101,pou4f2_37,mir663a_50以及sox1-ot_74中的至少一种。11、在一些实施例中,所述预测分型信息包括受试者的分型,所述受试者的分型包括:正常健康、前列腺增生、输尿管结石、前列腺癌、包含前列腺癌和前列腺腺泡癌、包含前列腺癌骨转移中的至少一种。12、本说明书实施例之一提供一种在具有至少一个处理器和至少一个存储设备的计算设备上实现的基于甲基化位点的前列腺癌相关数据分析方法,包括:基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,所述分型预测模型为机器学习模型;基于所述初始分型,确定预测分型信息。13、本说明书实施例之一提供一种非暂时性计算机可读介质,包括至少一组指令,其中当由计算设备的至少一个处理器执行时,所述至少一组指令使所述计算设备执行一种方法,所述方法包括:基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,所述分型预测模型为机器学习模型;基于所述初始分型,确定预测分型信息。技术特征:1.一种基于甲基化位点的前列腺癌相关数据分析系统,其特征在于,所述系统包括:2.根据权利要求1所述的系统,其特征在于,所述前列腺癌相关数据包括所述受试者的dna样本的原始测序数据经过数据处理后的数据,所述原始测序数据包括甲基化数据和测序深度数据的至少一种,所述甲基化数据包括甲基化位点的甲基化比例。3.根据权利要求2所述的系统,其特征在于,所述分型预测模型至少包括第一模型、第二模型、第三模型和第四模型中的两个,所述前列腺癌相关数据至少包括第一相关数据、第二相关数据、第三相关数据和第四相关数据中的两个,所述初始分型至少包括第一初始分型、第二初始分型、第三初始分型和第四初始分型中的两个;所述基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,包括:4.根据权利要求3所述的系统,所述第一预处理包括:5.根据权利要求3所述的系统,所述第二预处理包括:6.根据权利要求3所述的系统,其特征在于,所述基于所述初始分型,确定预测分型信息,包括:7.根据权利要求6所述的系统,其特征在于,所述投票规则基于所述甲基化位点的个数确定。8.根据权利要求3所述的系统,其特征在于,所述系统还包括训练模块,所述训练模块被配置为:9.根据权利要求8所述的系统,其特征在于,所述训练模块被进一步配置为:10.根据权利要求1所述的系统,其特征在于,所述甲基化位点包括igfbp3_36,pou4f2_37,mir663a_50,mir663a_37,znf154_73,mir663a_55,mir663a_61,igfbp3_44,igfbp3_40,znf154_53,pou4f2_74,mir663a_21,mir663a_104,fezf2_31,fezf2_58,mir663a_42,serpinb1_36,mir663a_90,fezf2_21,mir663a_86,fhad1_57,igfbp3_83,igfbp3_36,pou4f2_9,znf154_73,serpinb1_51,fezf2_48,apc_45,igfbp3_63,sox1-ot_89,apc_110,pou4f2_48,apc_78,igfbp3_40,fezf2_31,mir663a_77,igfbp3_101,pou4f2_37,mir663a_50以及sox1-ot_74中的至少一种。11.根据权利要求1所述的系统,其特征在于,所述预测分型信息包括受试者的分型,所述受试者的分型包括:正常健康、前列腺增生、输尿管结石、前列腺癌、包含前列腺癌和前列腺腺泡癌、包含前列腺癌骨转移中的至少一种。12.一种在具有至少一个处理器和至少一个存储设备的计算设备上实现的基于甲基化位点的前列腺癌相关数据分析方法,其特征在于,包括:13.一种非暂时性计算机可读介质,其特征在于,包括至少一组指令,其中当由计算设备的至少一个处理器执行时,所述至少一组指令使所述计算设备执行一种方法,所述方法包括:技术总结本说明书实施例提供一种基于甲基化位点的前列腺癌相关数据分析系统和方法,该系统包括:数据分析模块,被配置为:基于甲基化位点的前列腺癌相关数据,通过分型预测模型,预测受试者的初始分型,所述分型预测模型为机器学习模型;基于所述初始分型,确定预测分型信息。技术研发人员:张道允,巩子英,方振轩,孙永华受保护的技术使用者:嘉兴允英医学检验有限公司技术研发日:技术公布日:2024/8/16

一种基于甲基化位点的前列腺癌相关数据分析系