一种基于大语言模型的中医知识深度挖掘方法
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本发明涉及医学信息处理,尤其涉及一种基于大语言模型的中医知识深度挖掘方法。、当前,国内外在医学大模型的研究已取得一定进展,但仍存在一些局限性和挑战:国外研究现状:国外的医学大模型主要集中于西医领域,且多以英语为主要语言,例如谷歌med-palm系列。这对于中医知识的挖掘和应用存在一定的局限... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本发明涉及医学信息处理,尤其涉及一种基于大语言模型的中医知识深度挖掘方法。背景技术:1、当前,国内外在医学大模型的研究已取得一定进展,但仍存在一些局限性和挑战:国外研究现状:国外的医学大模型主要集中于西医领域,且多以英语为主要语言,例如谷歌med-palm系列。这对于中医知识的挖掘和应用存在一定的局限性,难以满足中医药的特定需求。国内研究现状:国内已经有研究团队开始关注中医大模型的开发,例如huatuogpt,doctorglm等。但相比于西医大模型,中医大模型的数量相对较少。此外,现有中医大模型所依托的数据质量参差不齐,影响了模型的最终效果。2、当前中医药数字化和智能化研究仍处于初级阶段,特别是在名老中医药专家经验的数字化活态传承方面不足,仍是一个待解决的关键科学问题。技术实现思路1、本发明的目的在于提供一种基于大语言模型的中医知识深度挖掘方法,旨在解决当前中医药数字化和智能化研究仍处于初级阶段,名老中医药专家经验的数字化活态传承不足的问题。2、为实现上述目的,本发明提供了一种基于大语言模型的中医知识深度挖掘方法,包括以下步骤:3、基于预训练模型对检索增强和模型微调数据源进行预处理,得到向量数据库、训练集、验证集和测试集;4、基于大语言模型分别对检索增强和模型微调进行训练,得到训练模型;5、所述训练模型基于用户输入查询知识库,并输出文本。6、其中,所述基于预训练模型对检索增强和模型微调数据源进行预处理,得到向量数据库、训练集、验证集和测试集的具体方式:7、基于预训练模型对检索增强数据源进行预处理,得到向量数据库;8、基于预训练模型对模型微调数据源进行预处理,得到训练集、验证集和测试集。9、其中,所述基于预训练模型对检索增强数据源进行预处理,得到向量数据库的具体方式:10、对数据源进行数据提取和清理,并转换为json格式数据;11、利用预训练模型将所述json格式数据转换为向量形式,并创建文本到向量的映射;12、基于向量检索方法检索向量检索库,加载预先保存的向量,创建向量数据库。13、其中,所述基于预训练模型对模型微调数据源进行预处理,得到训练集、验证集和测试集的具体方式:14、对数据源进行数据提取和清理,将其转化为文本类型数据;15、基于文本类型数据设计问答对提取算法,提取高质量问答对;16、按照模型要求数据格式组织数据,按照比例划分为训练集、验证集和测试集。17、本发明的一种基于大语言模型的中医知识深度挖掘方法,基于预训练模型对检索增强和模型微调数据源进行预处理,得到向量数据库、训练集、验证集和测试集;基于大语言模型分别对检索增强和模型微调进行训练,得到训练模型;所述训练模型基于用户输入查询知识库,并输出文本,基于大语言模型对检索增强和模型微调数据源进行预处理,得到向量数据库、训练集、验证集和测试集;分别对检索增强和模型微调进行训练,得到训练模型;所述训练模型基于用户输入查询知识库,并输出文本,该方法利用先进的大语言模型技术,通过深度学习与理解中医药经典文献,实现了对中医药知识的数字化、智能化传承与应用,构建中医药经典知识与实践相融合的活态传承模式,将传统中医药知识与现代医学实践相结合,为中医药领域的发展提供了新的思路和方法,该方法同时使用了检索增强和大语言模型,结合二者的优点,辅以强化学习技术,既能够解释中医领域的名词和症候,又能够根据患者的输入判断其症候并给出解决治疗方案,解决当前中医药数字化和智能化研究仍处于初级阶段,名老中医药专家经验的数字化活态传承不足的问题。技术特征:1.一种基于大语言模型的中医知识深度挖掘方法,其特征在于,包括以下步骤:2.如权利要求1所述的一种基于大语言模型的中医知识深度挖掘方法,其特征在于,3.如权利要求2所述的一种基于大语言模型的中医知识深度挖掘方法,其特征在于,4.如权利要求1所述的一种基于大语言模型的中医知识深度挖掘方法,其特征在于,技术总结本发明涉及医学信息处理技术领域,具体涉及一种基于大语言模型的中医知识深度挖掘方法,基于大语言模型对检索增强和模型微调数据源进行预处理,得到向量数据库、训练集、验证集和测试集;分别对检索增强和模型微调进行训练,得到训练模型;所述训练模型基于用户输入查询知识库,并输出文本,该方法同时使用了检索增强和大语言模型,结合二者的优点,辅以强化学习技术,既能够解释中医领域的名词和症候,又能够根据患者的输入判断其症候并给出解决治疗方案,解决当前中医药数字化和智能化研究仍处于初级阶段,名老中医药专家经验的数字化活态传承不足的问题。技术研发人员:李莉,于嵩,许芳菲,苏俊峰,唐熙,许枭飞,李孟灵,万鹏,刘超男,朱世宇,杨志胜,赵稳稳,尹钟伟,周昊受保护的技术使用者:西南大学技术研发日:技术公布日:2024/8/16