一种抑郁症风险预测模型的构建方法_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种抑郁症风险预测模型的构建方法

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种抑郁症风险预测模型的构建方法
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及计算机,具体涉及一种抑郁症风险预测模型的构建方法。、由于抑郁症异质性高,病因复杂,受社会、心理、生物等多因素影响,迄今为止,抑郁症的病因及发病机制尚不明确,目前仍缺乏有效的抑郁症早期识别、客观诊断和精准治疗的综合体系,治疗上循证证据仍十分不足。、申请号为cn.的中国专利公开了一种...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及计算机,具体涉及一种抑郁症风险预测模型的构建方法。背景技术:1、由于抑郁症异质性高,病因复杂,受社会、心理、生物等多因素影响,迄今为止,抑郁症的病因及发病机制尚不明确,目前仍缺乏有效的抑郁症早期识别、客观诊断和精准治疗的综合体系,治疗上循证证据仍十分不足。2、申请号为cn202311601376.3的中国专利公开了一种抑郁症并发代谢综合征的风险预测评估模型构建方法,包括步骤:从电子病历数据库中获取mdd患者数据,筛选出符合标准的mdd患者;获取mdd患者的协变量数据,通过协变量数据计算得到每个mdd患者的体重指数,结合血生化指标进行代谢综合征的评估;筛选出合并代谢综合征的mdd患者作为病例组,未合并代谢综合征的mdd患者作为对照组患者,获取病例组患者的数据作为病例组数据,获取对照组患者的数据作为对照组数据 ;对 病 例 组 和 对 照 组 数 据 进 行 二分 类 logisitic回归分析,获取相关影响因素结果;使用倾向性评分对混杂因素进行匹配,利用贝叶斯网络分析,按照步骤建立风险预测评估模型。该风险预测评估模型能够准确评价不同特征抑郁症患者合并代谢综合征的风险大小。3、上述技术方案仍存在如下缺陷:①虽然能够准确评价不同特征抑郁症患者合并代谢综合征的风险大小,但在临床中,抑郁症合并代谢综合征的患者并不多见,因此存在病例组样本量不足,由此用贝叶斯网络构建的风险预测评估模型可能不够准确;②贝叶斯网络是一种将有向无环图和贝叶斯概率相结合的机器学习算法,可直观表示多个变量的联合概率分布,处理不完整的数据,通过概率推断来估计不确定性。然而使用贝叶斯网络进行风险预测存在着一些挑战和限制,如贝叶斯网络推断算法适用于处理单一类型的数据,需要足够的样本数据来训练模型,模型的构建和推断结果可能受到数据结构和先验知识的限制,泛化能力可能比较弱;结构学习较为困难,通常需要手动构建网络结构或依赖专家知识;推理算法的计算复杂度高,不适用于实时处理场景。4、多模态数据算法在构建风险预测模型时具有以下优势:①能利用来自不同数据源或不同类型的数据,提供更全面的信息;②能将不同模态的数据特征进行融合,构建更强大和更具表征性的特征表示,有助于提高模型预测准确性;③能从多个数据源中学习数据的统计规律和潜在关系,从而提高模型的泛化能力;④采用深度学习等灵活的建模方法,能够自动学习数据之间的复杂关系,并适应不同类型的数据和问题;⑤能够较好的适应实时数据流的处理需求,能够处理大规模和高纬度的数据,具有较高的计算效率。5、因此,构建一种抑郁症风险预测模型,实现抑郁症早期识别、客观诊断和精准治疗的综合体系,对有效预防抑郁症的发生以及辅助临床医生有针对性、个体化的指导抑郁症的治疗至关重要,且采用多模态数据算法构建一种抑郁症风险预测模型能够更全面地利用不同类型的数据信息,构建更准确和可靠的风险预测模型。技术实现思路1、本发明的目的是为了解决上述问题,提供一种抑郁症风险预测模型的构建方法。2、为了达到上述目的,本发明的技术方案如下:3、一种抑郁症风险预测模型的构建方法,包括以下步骤:4、s1、抑郁症患者筛选5、基于社区/学校队列和医院精神科门诊、病房平台,筛选出符合标准的抑郁症患者为病例组,健康人群为对照组;6、s2、数据采集7、采集基线和随访过程中病例组和对照组的宏观-微观环境信息数据;8、s3、数据分析9、对步骤s2中采集的病例组和对照组数据进行统计分析,从基因组成-转录调控-蛋白表达-肠道微生物-代谢通路以及脑功能网络-认知-行为-环境多层次水平上获取抑郁症发病的相关影响因素结果;10、s4、早期个体化预警11、基于大数据和人工智能方法实现抑郁症患者的早期个体化预警;12、s5、构建风险预测模型13、使用倾向性评分对混杂因素进行匹配,利用多模态数据算法,按照步骤构建风险预测模型。14、进一步,在步骤s1中,所述抑郁症患者筛选的方法是基于社区/学校队列和医院精神科门诊、病房平台,搭建实时的在线调查平台,并结合入户调查的形式进行数据核查、补充和完善,形成对整群抽样社区全人群不同生命周期大数据库的调查,根据《精神疾病诊断与统计手册》第五版的诊断标准,筛选符合标准的抑郁症患者为病例组,健康人群为对照组。15、进一步,在步骤s2中,所述宏观-微观环境信息数据包括但不局限于社会因素、物理环境、心理环境、遗传因素、微生物环境、生化与代谢和脑电-脑神经影像;16、所述社会因素包括但不局限于经济和医疗服务因素;17、所述心理环境包括但不局限于社会心理、临床特征和神经心理指标。18、进一步,在步骤s3中,所述对采集的病例组和对照组数据进行统计分析的方法为二分类logisitic回归分析方法。19、进一步,在步骤s4中,所述早期个体化预警的具体操作如下:20、s41:系统采集、追踪并整合普通人群和特殊人群的宏观、微观等各项变量,汇集到脑疾病临床研究大数据库;21、s42、基于大数据和人工智能方法通过高级算法实现抑郁症患者的个体化预警。22、进一步,在步骤s42中,所述基于大数据和人工智能方法通过高级算法实现抑郁症患者的个体化预警的具体操作如下:23、s421、首先使用逻辑回归模型进行预测分类;24、s422、将模型的预测结果与阈值进行比对、判断,如果预测患者的抑郁症概率超过阈值,则发出预警提示。25、进一步,在步骤s421中,所述预测函数为:26、 p (yi=1|xi) = σ (wtxi+b), 27、其中 p (yi=1|xi)表示患者i的抑郁症的概率,w是模型的权重向量,b是偏置, σ (.)是逻辑函数(logistic sigmoid), t 表示权重向量的转置,目的是计算特征向量的加权。 28、进一步,在步骤s422中,所述模型的预测结果与阈值进行比对、判断公式如下:if p (yi=1|xi) > f, 则发出预警提示,其中  p (yi=1|xi)表示患者i的抑郁症的概率,f表示阈值。 29、进一步,在步骤s5中,所述风险预测模型构建的具体操作如下:使用卡方检验比较病例组和对照组患者性别、年龄等协变量数据的差异,使用倾向性评分匹配减少两组的选择偏差,利用多模态数据算法,建立风险预测评估模型;30、所述所有的病例组患者和对照组患者按年龄和性别1:1匹配。31、进一步,在步骤s5中,所述多模态模型算法包括如下步骤:32、s51、多模态数据特征预处理:包括数据清洗,评分与转换,异常值处理,数据归一化;33、s52、数据对齐:针对预处理后的数据依次进行进行空间对齐、 时间同步和模态间融合。34、s53、深度学习与模式识别;35、s54、交叉验证:采用5折交叉验证方法,将数据集被划分为五个大小相等的子集,每一次,一个子集被作为测试集,而其余的子集被用来训练模型,重复五次,确保每个子集都有一次机会被作为测试集;36、s55、性能评估:采用了一套遵循严格科学原则和统计标准的评估方法,以全面、客观地评价所开发算法在实际应用场景中的性能,确保结果的可重复性和可靠性。37、进一步,在步骤s53中,所述深度学习与模式识别包括:38、①特征提取:利用加权组合、主成分分析(pca)、因子分析等统计方法来减少数据的维度同时保留最有价值的信息,利用深度学习从复杂数据中提炼出有用的关键信息;39、②模型训练:采用多种机器学习算法分别构建不同预测模型,通过预测性能的比较选择最优分类模型,从而实现对抑郁风险的高精度预测;40、③卷积神经网络(cnn):通过卷积层自动并有效地提取图像特征,并通过层级结构逐渐抽象成更高级的图像语义信息,使用sigmoid激活函数在cnn中实现二元分类,通过学习图像的复杂特征来自动并准确地进行分类决策;41、④残差网络(resnet):通过引入残差学习框架来解决深层网络训练困难的问题;resnet能极大地提升训练的效率和准确性、在resnet网络的最末端加入一个全连接层,使用sigmoid激活函数,网络能够输出一个介于0和1之间的概率值,表示样本属于某一类的可能性;42、⑤注意力机制(attention mechanism):通过自注意力(self attention)机制捕捉输入序列内各元素间的全局依赖关系,在最后通常会通过一个或多个全连接层将聚焦后的特征信息映射到二元输出上;这些全连接层的末端通常采用sigmoid激活函数来输出一个介于0和1之间的概率值,表示样本属于目标类别的可能性;43、⑥生成对抗网络(gan):gan由一个生成网络和一个判别网络组成,通过二者的对抗过程提高生成的图像质量。44、使用人工智能模型在人脸图像处理中的应用不仅提高了识别和分析的准确性,也为深入理解人脸图像中的复杂信息提供了强大的工具。在gan框架内实现二元分类主要依赖于判别器d的功能,gan的判别器部分能够利用其学习到的复杂和深层次的图像特征来进行高准确度的分类决策。45、⑦自注意力模型(transformer):是一种在多个视觉任务上表现强大的网络模型,包括图像分类、目标检测和分割。46、进一步,所述残差网络的核心公式为:47、,48、其中x和y分别是网络的输入和输出,表示学习的残差映射,表示模型的权重参数集合,通常包含多个权重向量或矩阵;49、进一步,所述对抗网络的核心公式为:50、,51、其中,g表示生成器,d表示判别器,ming表示生成器 g 尝试最小化目标函数,maxd表示判别器 d 尝试最大化目标函数, v(d,g)表示 gan 的价值函数,表示生成器和判别器之间的对抗目标;e表示期望值运算符,表示样本x来自于真实数据分布pdata(x);log d(x)表示判别器 d 对真实样本x的输出, 判别器 d 的目标是将真实数据x判定为真(输出接近 1),因此 logd(x)的值越大越好;表示输入因素z来自于因素分布,表示生成器g根据因素z生成的假数据,表示判别器d对生成数据的输出,判别器d的目标是将生成数据判定为假(输出接近0),因此的值越大越好。52、此外,需要说明的是本发明涉及的自注意力模型(transformer)模型包含自适应n×n卷积编码器和拆分深度转置注意力编码器两个组件。53、首先,模型通过四个不同尺度的阶段提取分层特征。输入图像经过patchify stem层,使用4×4非重叠卷积,然后跟随一个layer norm层,生成h/4×w/4×c1特征图。接下来,输出传递给3×3卷积层,编码器提取局部特征。54、第二阶段从使用2×2跨步卷积实现的下采样层开始,将空间大小减半并增加通道,生成h/8×w/8×c2特征图,接着是两个连续的5×5卷积编码器。而位置编码仅在第二阶段之前添加。对于密集预测任务(如目标检测和分割),patchify stem非常敏感,因此,只在网络中添加一次以对空间位置信息进行编码。输出特征图继续传递到第三和第四阶段,分别生成h/16×w/16×c3和h/32×w/32×c4维特征。55、采用多样的性能评估指标与卷积网络、vit和其他混合模型进行全面比较,以充分展示模型在各个任务上的竞争力。56、transformer模型通过最后的全连接层实现二元分类,该层将模型通过自注意力机制和多层感知机学习到的高维特征映射到两个类别上。57、综上所述,本发明具有以下有益效果:58、1. 本发明从社会、心理、生物学(基因敏感性、神经环路、肠道菌群等)等多维度、多层面及其交互作用,建立全人群、全生命周期的抑郁症风险预测、个体化预防、早期诊断和精准治疗等多维度指标体系和模型。59、2. 本发明采用人工智能融合性分析技术,实时监测、分析自然状态下从健康到疾病、从疾病到康复状态的转化以及医学干预对疾病转归的影响因素,建立和开发抑郁症的高危人群预警、风险预测模型,并通过随访动态实时优化预测模型,最终提高抑郁症的早期风险预测和诊断、早期就诊率,降低抑郁症的致残率等。60、3.本发明采用多模态数据算法构建的风险预测模型能够更全面地利用不同类型的数据信息,将不同模态的数据特征进行融合,构建更强大和更具表征性的特征表示,提高模型预测的准确性和可靠性;还能够较好的适应实时数据流的处理需求,能够处理大规模和高纬度的数据,具有较高的计算效率。

一种抑郁症风险预测模型的构建方法