CHB合并HS的进展期纤维化和肝硬化的诊断系统及其
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及疾病及诊断信息的数据处理领域,特别是一种慢性乙型肝炎(chb)合并肝脂肪变性(hepatic steatosis,hs)的进展期纤维化和肝硬化的诊断系统及其构建方法。、乙型肝炎病毒(hbv)感染和非酒精性脂肪性肝病(nafld)是慢性肝病(cld)的两个主要原因,导致肝硬化和肝细... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及疾病及诊断信息的数据处理领域,特别是一种慢性乙型肝炎(chb)合并肝脂肪变性(hepatic steatosis,hs)的进展期纤维化和肝硬化的诊断系统及其构建方法。背景技术:1、乙型肝炎病毒(hbv)感染和非酒精性脂肪性肝病(nafld)是慢性肝病(cld)的两个主要原因,导致肝硬化和肝细胞癌(hcc)等肝脏相关并发症的风险增加。全球范围内,慢性乙型肝炎(chb)的全年龄段估计患病率约为4.0%,相当于近3亿感染者。与此同时,全球范围内的nafld患病率呈上升趋势,按比例归因于肥胖和2型糖尿病的流行。到2015年,全球nafld的患病率已累计达到25.24%。此外,我们之前的研究指出,亚洲的nafld患病率为29.62%,并在不断上升。在nafld患者中,chb患者并发nafld在临床上很常见,可能会加速慢性肝病的发展。一项涉及53项研究的荟萃分析显示,这类患者中显著纤维化和晚期纤维化的合并比例分别接近33%和40%。2、此外,许多研究已经证实,脂肪性肝炎的存在与慢性乙型肝炎患者肝相关疾病和死亡风险的增加显著相关,如晚期纤维化、肝硬化和hcc。对于慢性乙型肝炎和非酒精性脂肪肝患者,风险分层的关键点在于肝纤维化阶段的区分,这是全因和肝相关死亡率的主要决定因素。然而,对于准确评估和风险分层这些患者肝纤维化严重程度的成本效益高的方法,仍有很多未满足的需求。3、有多种方法可以识别纤维化,包括肝活检、磁共振弹性成像(mre)和基于血液的生物标志物,包括ast与血小板比值指数(apri)、nafld纤维化评分(nfs)和纤维化-4指数(fib-4)。尽管这些测试很常用,但也有其自身的局限性和缺点。例如,肝活检作为金标准,可以验证所有非侵入性方法,但受限于其侵入性、可接受性差、易于采样错误、手术成本高以及术后并发症的风险,如剧烈疼痛、出血、其他内脏损伤等。nfs和fib-4这两种具有代表性的非侵入性测试(nit)的主要缺点包括识别早期纤维化阶段的准确性降低,以及没有确定结果的患者比例高。同样,apri是在慢性丙型肝炎(chc)患者中开发的,在该人群中对晚期纤维化具有良好的准确性,但在nafld患者中表现平平,在慢性乙型肝炎患者中不太可靠。简而言之,这些诊断工具能够准确区分肝硬化与无纤维化或轻度纤维化,但未能在不同的纤维化阶段划清界限。因此,迫切需要低成本、低风险、能够临床评估慢性乙型肝炎nafld患者肝纤维化的精确而敏感的工具。技术实现思路1、本发明的目的在于提供一种低成本、低风险的chb合并hs的进展期纤维化和肝硬化的诊断系统及其构建方法,从而对慢性乙型肝炎nafld患者的肝纤维化进行精确评估。2、实现本发明目的的技术解决方案为:一种chb合并hs的进展期纤维化和肝硬化的诊断系统,包括样本采集模块、预模型构建模块、特征选择模块、进展期纤维化的诊断模型构建模块、肝硬化的诊断模型构建模块和效能评估模块,其中:3、所述样本采集模块,从医疗记录中采集接受肝活检的chb合并hs患者的临床和实验室信息;所述chb表示慢性乙型肝炎,hs表示肝脂肪变性;4、所述预模型构建模块,使用随机森林机器学习算法,纳入多重插补后训练队列的临床特征,建立诊断进展期纤维化和肝硬化的预模型;5、所述特征选择模块,分别确定与进展期纤维化相关的临床特征,以及与肝硬化相关的临床特征;6、进展期纤维化的诊断模型构建模块,用于构建进展期纤维化的诊断模型;7、肝硬化的诊断模型构建模块,用于构建肝硬化的诊断模型;8、所述效能评估模块,计算模型诊断晚期纤维化和肝硬化的受体操作特征曲线下的最佳面积。9、进一步地,所述样本采集模块,具体如下:10、收集多家医院接受肝活检的chb合并hs患者,其中chb是指乙型肝炎表面抗原hbsag阳性至少6个月的患者,hs为经肝活检证实的hs;11、基于血清学指标,从参与医院的医疗记录中检索与患者相关的临床和实验室信息。12、进一步地,所述模型构建模块,使用随机森林机器学习算法,纳入多重插补后训练队列的临床特征,建立诊断进展期纤维化和肝硬化的预模型,具体如下:13、随机森林机器学习算法由多个决策树组成,每个决策树均基于随机抽样得到的数据集和随机选择的特征进行训练,通过投票或平均值的方式综合多个决策树的预测结果来进行分类或回归预测;14、在随机森林中,通过5折交叉验证的方法,将原始的数据集分成5个子集,每次选择其中一个子集作为验证集,其余四个子集为训练集来训练随机森林模型即诊断晚期纤维化和肝硬化的预模型,重复这个过程5次,并计算每次验证的性能指标的平均值,得到最终的预模型以及对预模型性能的客观评估。15、进一步地,训练队列的临床特征具体包括以下23个:16、年龄、性别、体重指数、是否患有糖尿病、是否患有高血压、白细胞计数、中性粒细胞计数、血红蛋白、血小板计数、总胆红素、白蛋白、谷丙转氨酶、谷草转氨酶、碱性磷酸酶、谷氨酰转肽酶、尿酸、胆固醇、甘油三脂、国际标准化比值inr、凝血酶原时间、乙肝表面抗原、乙肝e抗原状态、乙型病毒脱氧核糖核酸。17、进一步地,对训练队列的缺失值进行多重插补,具体如下:18、训练队列的数据量大于600个chb合并hs患者,针对训练队列的缺失值,采用链式方程多重插补即mice方法进行多重插补;19、mice方法基于贝叶斯统计学,假设缺失数据的产生是随机的,与其他变量之间存在一定的关系;通过将缺失数据的填补过程分解为多个步骤,每个步骤均基于一个回归模型或预测模型来估计缺失值,并根据已知变量的值不断更新缺失数据的估计值,直至收敛或达到预定迭代次数。20、进一步地,使用python软件的miceforest包对训练队列的缺失值进行多重插补,具体为:21、miceforest包基于mice方法,设置均值匹配方案为随机森林且均值匹配样本数目为5,对缺失值进行插补;通过n次迭代得到n+1份不同的插补后的完整数据集,n为整数且n≥3;22、对经过多重插补后的完整数据集进行均值变化量的比较,选择均值变化量最小的组成最终的完整数据集。23、进一步地,所述进展期纤维化的诊断模型构建模块,用于构建进展期纤维化的诊断模型,具体如下:24、应用shap评分来评估每个临床特征的重要性,并根据预模型对进展期纤维化和所有特征之间的总体关系进行定量描述;25、通过使用shap值,对预模型中23个临床特征的权重进行排序;26、基于前7项临床特征,包括白蛋白、碱性磷酸酶、体重指数、谷氨酰转肽酶、国际标准化比值inr、血小板计数、凝血酶原时间,构建进展期纤维化的诊断模型。27、8、根据权利要求6所述的chb合并hs的进展期纤维化和肝硬化的诊断系统,其特征在于,所述肝硬化的诊断模型构建模块,用于构建肝硬化的诊断模型,具体如下:28、应用shap评分来评估每个临床特征的重要性,并根据预模型对肝硬化和所有特征之间的总体关系进行定量描述;29、通过使用shap值,对预模型中23个临床特征的权重进行排序;30、基于前11项临床特征,包括年龄、白蛋白、碱性磷酸酶、体重指数、谷氨酰转肽酶、乙肝表面抗原、inr、血小板计数、凝血酶原时间、胆固醇、白细胞计数,构建肝硬化的诊断模型。31、一种如所述的chb合并hs的进展期纤维化和肝硬化的诊断系统的构建方法,该方法包括以下步骤:32、步骤1、构建样本采集模块,样本采集模块从医疗记录中采集接受肝活检的chb合并hs患者的临床和实验室信息;33、步骤2、使用随机森林机器学习算法,纳入多重插补后训练队列的临床特征,建立诊断进展期纤维化和肝硬化的预模型;34、步骤3、构建特征选择模块,分别确定与进展期纤维化相关的临床特征,以及与肝硬化相关的临床特征;35、步骤4、基于步骤2所建立的预模型,构建进展期纤维化的诊断模型;36、步骤5、基于步骤2所建立的预模型,构建肝硬化的诊断模型;37、步骤6、构建效能评估模块,计算诊断模型所诊断进展期纤维化和肝硬化的受体操作特征曲线下的最佳面积。38、一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现所述的chb合并hs的进展期纤维化和肝硬化的诊断系统的构建方法中的步骤。39、本发明与现有技术相比,其显著优点为:40、(1)随机森林是一种集成学习方法,能够有效减少过拟合的风险,提高模型的泛化能力,能够处理非线性关系,适用于复杂的医学数据分析场景;41、(2)chb合并hs的患者率高,然而目前尚无针对此类人群的纤维化评估的方法,本发明构建了针对此类人群的纤维化评估的诊断系统;42、(3)诊断系统基于容易获得的血清学指标构建,成本低、风险低、容易操作且对患者伤害小。