一种医疗诊断术语智能分析方法及装置与流程_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种医疗诊断术语智能分析方法及装置与流程

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种医疗诊断术语智能分析方法及装置与流程
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本申请涉及医疗诊断数据标准化处理,具体涉及一种医疗诊断术语智能分析方法及装置。、世界卫生组织发布的疾病和有关健康问题的国际统计分类(icd-)中各类别都是单个疾病,而患者在医院就诊时有时会有多种疾病。由于缺少对电子病历系统多疾病填写的明确要求,且部分医院是手动输入疾病信息,由于书写习惯的差...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本申请涉及医疗诊断数据标准化处理,具体涉及一种医疗诊断术语智能分析方法及装置。背景技术:1、世界卫生组织发布的疾病和有关健康问题的国际统计分类(icd-10)中各类别都是单个疾病,而患者在医院就诊时有时会有多种疾病。由于缺少对电子病历系统多疾病填写的明确要求,且部分医院是手动输入疾病信息,由于书写习惯的差异,导致各医院数据中,诊断名称在填写时,存在多个诊断且分隔符各异,或者有添加注释、说明、症状、病理、名称和编码共存以及错别字等情况。2、随着数据资产化和交易化的发展,医疗数据利用的场景越来越多,靠人工拆分或者直接同icd-10匹配,都已经无法满足快速增加的数据治理时效性和准确性要求。目前,在处理临床诊断数据时主要采用正则表达式,正则表达式是一种用于匹配和处理文本的强大工具,但在处理诊断数据时可能存在以下缺陷:3、复杂性:处理诊断数据时,正则表达式可能变得非常复杂。这是因为诊断数据往往具有复杂和多样化的结构,并涉及不同的数据格式和模式,所以编写和维护复杂的正则表达式可能会变得困难,并且容易出错。4、不灵活:正则表达式在处理动态数据时可能不够灵活。例如,对于变化的数据格式或动态生成的诊断数据,正则表达式可能无法准确地捕获和处理所有情况,这可能导致遗漏重要的数据或错误地匹配无关的数据。5、效率问题:处理大量诊断数据时,正则表达式可能会导致性能问题。某些复杂的正则表达式可能需要耗费大量的计算资源和时间来执行匹配操作,这可能使处理时间变得很长,特别是在大规模的数据集上。6、错误处理困难:对于复杂的正则表达式,当出现错误时,调试和定位问题可能会变得复杂。正则表达式的错误消息通常不够详细和直观,这使得排除错误和修复问题变得困难。技术实现思路1、为此,本申请提供一种医疗诊断术语智能分析方法及装置,以解决现有技术存在的医疗数据处理方法复杂度高、灵活性差、效率低以及错误处理困难的问题。2、为了实现上述目的,本申请提供如下技术方案:3、第一方面,一种医疗诊断术语智能分析方法,包括:4、步骤1:获取排重后的门诊记录和住院记录的诊断编码和诊断名称;5、步骤2:将所述诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配,得到标准诊断词条和需要拆分的诊断词条;其中,所述标准字典包括标准编码字典和标准名称字典;6、步骤3:将需要拆分的诊断词条进行占位替换,得到替换后的诊断词条;7、步骤4:将替换后的诊断词条进行序列拆分,得到序列拆分后的诊断词条;8、步骤5:判断序列拆分后的诊断词条是否需要进行符号拆分,若需要,则进行符号拆分,得到符号拆分后的诊断词条;9、步骤6:遍历符号拆分后的的诊断词条,对占位替换后的内容进行占位还原,并去除前后无效符号后进行归类,得到拆分结果;10、步骤7:根据预先训练好的诊断检测模型判断拆分结果的拆分顺序是否正确、拆分结果中是否含有拆分符号以及拆分结果中是否含有非诊断性词语。11、可选地,所述步骤2中,所述标准字典的构建过程包括:12、获取国际疾病分类内容,利用自然语言处理技术对国际疾病分类内容进行标准化和扩充处理,得到所有符号;13、将所有符号转换为全角字符,并识别出全角字符中以括号结尾且括号内为编码的诊断名称,并复制一条不带括号的;14、使用pytrie模块加载诊断编码和诊断名称形成所述标准编码字典,加载诊断名称形成所述标准名称字典。15、可选地,所述步骤2中,将所述诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配之前还包括:将所述诊断编码和诊断名称进行预处理,预处理包括诊断名称变体、去除编码前缀、去除编码后缀以及半角符号转全角符号。16、可选地,所述步骤3具体包括:识别出需要拆分的诊断词条中带括号的内容和带有分隔符但不能拆分的术语,然后将它们替换为占位符,并缓存替换前后的内容。17、可选地,所述识别出需要拆分的诊断词条中带括号的内容时具体包括:使用语言表达处理公式将[[[【(({].*?[}))】]]]识别出来,并排除序列情况。18、可选地,所述步骤4中,序列拆分时按照序列(1.2.3.)的格式进行拆分。19、可选地,所述步骤4之后还包括:将序列拆分后的诊断词条通过字典匹配模块判断是否能从所述标准名称字典或所述拆分字典中匹配到结果。20、第二方面,一种医疗诊断术语智能分析装置,包括:21、原始数据获取模块,用于获取排重后的门诊记录和住院记录的诊断编码和诊断名称;22、数据分类模块,用于将所述诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配,得到标准诊断词条和需要拆分的诊断词条;其中,所述标准字典包括标准编码字典和标准名称字典;23、占位替换模块,用于将需要拆分的诊断词条进行占位替换,得到替换后的诊断词条;24、序列拆分模块,用于将替换后的诊断词条进行序列拆分,得到序列拆分后的诊断词条;25、符合拆分模块,用于判断序列拆分后的诊断词条是否需要进行符号拆分,若需要,则进行符号拆分,得到符号拆分后的诊断词条;26、占位还原模块,用于遍历符号拆分后的的诊断词条,对占位替换后的内容进行占位还原,并去除前后无效符号后进行归类,得到拆分结果;27、拆分检测模块,用于根据预先训练好的诊断检测模型判断拆分结果的拆分顺序是否正确、拆分结果中是否含有拆分符号以及拆分结果中是否含有非诊断性词语。28、第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求一种医疗诊断术语智能分析方法的步骤。29、第四方面,一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现一种医疗诊断术语智能分析方法的步骤。30、相比现有技术,本申请至少具有以下有益效果:31、本申请提供了一种医疗诊断术语智能分析方法及装置,通过获取排重后的门诊记录和住院记录的诊断编码和诊断名称,将诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配,得到标准诊断词条和需要拆分的诊断词条;将需要拆分的诊断词条进行占位替换、序列拆分、符号拆分以及占位还原后得到拆分结果,根据预先训练好的诊断检测模型判断拆分结果的拆分顺序是否正确、拆分结果中是否含有拆分符号以及拆分结果中是否含有非诊断性词语,从而确保拆分出的诊断术语具备较高的诊断价值,并能够为后续的医疗诊断和决策提供更精确的支持。整个医疗诊断术语智能分析过程灵活度高,效率高,且不容易出错。技术特征:1.一种医疗诊断术语智能分析方法,其特征在于,包括:2.根据权利要求1所述的医疗诊断术语智能分析方法,其特征在于,所述步骤2中,所述标准字典的构建过程包括:3.根据权利要求1所述的医疗诊断术语智能分析方法,其特征在于,所述步骤2中,将所述诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配之前还包括:将所述诊断编码和诊断名称进行预处理,预处理包括诊断名称变体、去除编码前缀、去除编码后缀以及半角符号转全角符号。4.根据权利要求1所述的医疗诊断术语智能分析方法,其特征在于,所述步骤3具体包括:识别出需要拆分的诊断词条中带括号的内容和带有分隔符但不能拆分的术语,然后将它们替换为占位符,并缓存替换前后的内容。5.根据权利要求4所述的医疗诊断术语智能分析方法,其特征在于,所述识别出需要拆分的诊断词条中带括号的内容时具体包括:使用语言表达处理公式将[[[【(({].*?[}))】]]]识别出来,并排除序列情况。6.根据权利要求1所述的医疗诊断术语智能分析方法,其特征在于,所述步骤4中,序列拆分时按照序列(1.2.3.)的格式进行拆分。7.根据权利要求1所述的医疗诊断术语智能分析方法,其特征在于,所述步骤4之后还包括:将序列拆分后的诊断词条通过字典匹配模块判断是否能从所述标准名称字典或所述拆分字典中匹配到结果。8.一种医疗诊断术语智能分析装置,其特征在于,包括:9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。技术总结本申请公开了一种医疗诊断术语智能分析方法及装置,涉及医疗诊断数据标准化处理技术领域,通过获取排重后的门诊记录和住院记录的诊断编码和诊断名称,将诊断编码和诊断名称与预先构建好的标准字典和拆分字典进行匹配,得到标准诊断词条和需要拆分的诊断词条;将需要拆分的诊断词条进行占位替换、序列拆分、符号拆分以及占位还原后得到拆分结果,根据预先训练好的诊断检测模型判断拆分结果的拆分顺序是否正确、拆分结果中是否含有拆分符号以及拆分结果中是否含有非诊断性词语,从而确保拆分出的诊断术语具备较高的诊断价值,并能够为后续的医疗诊断和决策提供更精确的支持。整个医疗诊断术语智能分析过程灵活度高,效率高,且不容易出错。技术研发人员:王小铃受保护的技术使用者:翼健(上海)信息科技有限公司技术研发日:技术公布日:2024/8/15

一种医疗诊断术语智能分析方法及装置与流程