一种利用机器学习识别影响抑郁水平的方法_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种利用机器学习识别影响抑郁水平的方法

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种利用机器学习识别影响抑郁水平的方法
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及机器学习分析,具体为一种利用机器学习识别影响抑郁水平的方法。、抑郁症状会导致身体机能衰退、生活质量降低和健康费用增加,将严重的影响中老年人的身心健康。在这种情况下,早期预测抑郁症状并分析风险形成原因对疾病控制和提高生活质量非常重要。、目前已经有大量基于实证方法的中老年人抑郁症状的...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及机器学习分析,具体为一种利用机器学习识别影响抑郁水平的方法。背景技术:1、抑郁症状会导致身体机能衰退、生活质量降低和健康费用增加,将严重的影响中老年人的身心健康。在这种情况下,早期预测抑郁症状并分析风险形成原因对疾病控制和提高生活质量非常重要。2、目前已经有大量基于实证方法的中老年人抑郁症状的相关因素研究(yunming等,2012),如(y.luo等,2023)采用二元逻辑回归分析饮食多样性、运动和抑郁症状的关系,发现饮食多样性是抑郁症状的保护因素,保持适当的体育活动可能减少抑郁症状;(jung等,2015)采用多变量逻辑回归分析,评估了抑郁患病率与月经初潮年龄和绝经期年龄之间可能存在的相互作用,发现月经开始和结束的年龄都与绝经后抑郁的优势比增加有关,更年期的年龄似乎更为重要;(mcmunn等,2021)采用多变量logistic回归方法检验工作-家庭与中年心理痛苦之间的关系,发现长期全职照顾的中年人心理健康和幸福感更差,长期失业以全职照顾家庭的女性发生心理痛苦的概率更明显。然而,对于仍可能影响抑郁的生活满意度和早期压力事件这类因素当前得到的重视程度不足。技术实现思路1、为了解决上述问题,本发明提供一种利用机器学习识别影响抑郁水平的方法,包括以下步骤:s1.收集历史数据并建立数据集;s2.建立多个机器学习预测模型,并根据数据集进行模型测试;s3.通过charls数据对抑郁症状进行分析,并结合shap对影响因素进行识别;s4.计算特定变量对抑郁水平预测值的影响。2、进一步地,所述s2步骤中所述的多个机器学习预测模型具体包括:随机森林预测模型、tabnet预测模型、catboost预测模型、extreme gradient boosting预测模型、lightgbm预测模型、gbdt预测模型。3、进一步地,所述s2步骤中具体包括:将数据集中80%的数据用于对预测模型进行构建,并将剩余的20%用于对预测模型进行测试。4、进一步地,所述s3步骤中charls数据具体包括:人口统计学变量、认知能力、个人养老金收入和家庭人均消费、早期生活压力事件、家庭结构、健康状况、生活满意度数据。5、进一步地,所述人口统计学变量包括:年龄、性别、教育程度、出生地、户口、婚姻状况、居住地;所述健康状况包括:自我报告健康、日常生活活动、日常生活中的工具性活动、上下身移动能力、身体健康、健康行为;所述家庭结构包括:家庭人数、在世或已故孩子数量、父母死亡率、父母的社会经济地位、生活安排、家庭成员联系、参与社会团体、家庭成员之间经济来往。6、进一步地,所述s3步骤中shap对影响因素进行识别具体为:对预测模型中的输入变量进行分析,并明确各个变量的重要程度及其净影响。7、进一步地,所述影响因素包括:r4satlife、r4slfmem、r4shlta、ragender、r4agey;其中,r4satlife表示受访者的生活满意度水平、r4slfmem表示自我报告记忆、r4shlta表示受访者自我报告的一般健康状况、ragender表示受访者性别、r4agey表示受访者在当前接受采访时的年龄。8、进一步地,所述s4步骤中计算特定变量对抑郁水平预测值的影响的计算方法具体包括:平均绝对误差、均方误差、中位绝对误差、均方根误差。9、本发明提供了一种利用机器学习识别影响抑郁水平的方法,具有以下有益效果:10、本发明提出了基于catboost模型的多混杂因素影响下的抑郁水平预测模型,取得了相比于其他机器学习和传统参数模型方法更准确的效果;提出了基于shap和ale的可解释方法,对于catboost模型的决策过程进行解释,克服了“黑箱子”的问题;基于整个可解释机器学习框架,以无假设的方式识别出最关键的抑郁水平影响因素,从混杂因素中排除了可能产生干扰的因子,证明了生活满意度最重要的地位。技术特征:1.一种利用机器学习识别影响抑郁水平的方法,其特征在于,包括以下步骤:2.根据权利要求1所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述s2步骤中所述的多个机器学习预测模型具体包括:随机森林预测模型、tabnet预测模型、catboost预测模型、extreme gradient boosting预测模型、lightgbm预测模型、gbdt预测模型。3.根据权利要求2所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述s2步骤中具体包括:将数据集中80%的数据用于对预测模型进行构建,并将剩余的20%用于对预测模型进行测试。4.根据权利要求1所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述s3步骤中charls数据具体包括:人口统计学变量、认知能力、个人养老金收入和家庭人均消费、早期生活压力事件、家庭结构、健康状况、生活满意度数据。5.根据权利要求4所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述人口统计学变量包括:年龄、性别、教育程度、出生地、户口、婚姻状况、居住地;6.根据权利要求1所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述s3步骤中shap对影响因素进行识别具体为:对预测模型中的输入变量进行分析,并明确各个变量的重要程度及其净影响。7.根据权利要求6所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述影响因素包括:r4satlife、r4slfmem、r4shlta、ragender、r4agey;其中,r4satlife表示受访者的生活满意度水平、r4slfmem表示自我报告记忆、r4shlta表示受访者自我报告的一般健康状况、ragender表示受访者性别、r4agey表示受访者在当前接受采访时的年龄。8.根据权利要求1所述的利用机器学习识别影响抑郁水平的方法,其特征在于,所述s4步骤中计算特定变量对抑郁水平预测值的影响的计算方法具体包括:平均绝对误差、均方误差、中位绝对误差、均方根误差。技术总结本发明公开了一种利用机器学习识别影响抑郁水平的方法,包括以下步骤:S1.收集历史数据并建立数据集;S2.建立多个机器学习预测模型,并根据数据集进行模型测试;S3.通过CHARLS数据对抑郁症状进行分析,并结合SHAP对影响因素进行识别;S4.计算特定变量对抑郁水平预测值的影响。本发明提出了基于CatBoost模型的多混杂因素影响下的抑郁水平预测模型,取得了相比于其他机器学习和传统参数模型方法更准确的效果,克服了“黑箱子”的问题;基于整个可解释机器学习框架,以无假设的方式识别出最关键的抑郁水平影响因素,从混杂因素中排除了可能产生干扰的因子,证明了生活满意度最重要的地位。技术研发人员:罗澜峻,李儒林,王雪燕受保护的技术使用者:川北医学院技术研发日:技术公布日:2024/8/16

一种利用机器学习识别影响抑郁水平的方法