药物代谢产物特征提取模型训练方法及其识别方_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

药物代谢产物特征提取模型训练方法及其识别方

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


药物代谢产物特征提取模型训练方法及其识别方
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及药代动力学,具体涉及药物代谢产物特征提取模型训练方法及其识别方法。、药物代谢产物的确定与机制研究是药物研发中的重要环节,它有助于深入了解药物在体内的代谢过程,预测药物的疗效和安全性,以及优化药物的设计和开发。传统的药物代谢产物与机制研究往往采用核磁共振数据分析分子结构或利用质谱数...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及药代动力学,具体涉及药物代谢产物特征提取模型训练方法及其识别方法。背景技术:1、药物代谢产物的确定与机制研究是药物研发中的重要环节,它有助于深入了解药物在体内的代谢过程,预测药物的疗效和安全性,以及优化药物的设计和开发。传统的药物代谢产物与机制研究往往采用核磁共振数据分析分子结构或利用质谱数据分析确定分子的质量、组成和结构等信息,然而上述两种方法均具有优缺点,其中,气相色谱-质谱联用质谱数据只能检测分析待测样品中的挥发性物质,样品中难挥发的代谢物质的信息则很难检测到。此外,气相色谱-质谱技术需要对样品进行衍生化的预处理,此过程较为耗时且容易引起样品的理化性质发生变化。而液相色谱-质谱联用的质谱数据可以获得代谢产物的相对分子量、分子式以及可能的官能团等信息。这种方法的优点是灵敏度高、可以快速地分析大量的样品。然而,液相色谱-质谱联用提供的信息可能不足以确定代谢产物的精确结构,特别是对于复杂的化合物。核磁共振数据通过测量原子核(如氢和碳)的磁性来提供分子的结构信息。它能够提供代谢产物的氢谱、碳谱和其他相关谱图,这些谱图可以揭示分子的详细结构,包括官能团、连接方式和三维构象等。然而,核磁共振数据的缺点是灵敏度相对较低。因此,无论采用哪一种方式,难以进行较为全面的代谢产物的识别。技术实现思路1、为解决上述背景技术中阐述的现有技术中如何进行较为全面的代谢产物的识别的技术问题,本技术提出了一种药物代谢产物特征提取模型训练方法及其识别方法。2、根据第一方面本技术实施例提供了一种药物代谢产物特征提取模型训练方法,其特征在于,所述特征提取模型包括图谱特征提取网络以及并列级联在所述图谱特征提取网络输出端的第一生成器和第二生成器,其中,所述第一生成器用于提取融合分子特征,所述第二生成器用于提取不同类型图谱对应的重构分子特征,所述训练方法包括:3、获取多组药物的代谢产物的质谱数据和核磁共振数据构建训练集,所述训练集包括具有药物标签的质谱数据和核磁共振数据;4、利用图谱特征提取网络分别提取所述质谱数据中的离子特征以及核磁共振数据中的原子特征;5、将所述离子特征和所述原子特征分别输入第一生成器生成融合分子特征;6、利用第一判别器对所述第一生成器进行至少一轮次的第一对抗学习,直至所述融合分子特征与所述代谢产物对应的原分子特征的第一相似度大于第一预设相似度,以使所述第一生成器学习所述原分子特征与所述离子特征和所述原子特征之间的融合映射关系;7、将所述离子特征和所述原子特征输入第二生成器分别生成所述离子特征对应的第一重构分子特征和所述原子特征对应的第二重构分子特征;8、利用第二判别器分别对所述第二生成器进行至少一轮次的第二对抗学习,直至所述第一重构分子特征和所述第二重构分子特征分别与所述原分子特征的第二相似度大于第二预设相似度,以使所述第二生成器分别学习所述离子特征与所述原分子特征之间的第一映射关系和所述原子特征与所述原分子特征之间的第二映射关系。9、可选地,所述第一生成器包括语义特征提取网络和特征融合网络;10、所述将所述离子特征和所述原子特征分别输入第一生成器生成融合分子特征包括:11、利用所述语义特征提取网络分别提取离子特征和所述原子特征中用于表征分子语义特征的第一语义特征集和第二语义特征集;12、基于交叉注意力机制利用特征融合网络将所述第一语义特征集和第二语义特征集进行融合,得到融合分子特征。13、可选地,所述利用第一判别器对所述第一生成器进行至少一轮次的第一对抗学习包括:14、在所述第一生成器训练阶段,最小化生成器损失函数,以使所述融合分子特征与对应的原分子特征的相似度增大,其中,所述生成损失函数基于用于融合所述第一语义特征集和第二语义特征集的重构损失和用于分类所述融合分子特征和原分子特征的分类损失确定;15、在所述第一判别器训练阶段,最大化判别损失函数,以使所述融合分子特征与对应的所述原分子特征能够被分类。16、可选地,所述第二生成器包括双分支循环神经网络;17、所述将所述离子特征和所述原子特征输入第二生成器分别生成所述离子特征对应的第一重构分子特征和所述原子特征对应的第二重构分子特征包括:18、将所述离子特征和所述原子特征分别输入所述双分支循环神经网络,分别得到所述第一重构分子特征和所述第二重构分子特征。19、可选地,所述利用第二判别器分别对所述第二生成器进行至少一轮次的第二对抗学习包括:20、在所述第二生成器训练阶段,最小化循环神经网络的损失函数,以使所述第一重构分子特征与原分子特征之间的相似度增大,且所述第二重构分子特征与原分子特征之间的相似度增大;21、在所述第二判别器训练阶段,最大化第二判别损失函数,以分别使所述第一重构分子特征和所述原子特征能够被分类,且所述第二重构分子特征与所述原分子特征能够被分类。22、可选地,所述特征提取模型还包括级联在所述第一生成器和所述第二生成器之后的药物标签特征提取网络;23、将所述融合分子特征,所述第一重构分子特征和所述第二重构分子特征以及对应的药物标签输入至所述药物标签特征提取网络,利用药物标签损失对药物标签特征提取网络进行约束训练,得到能够提取药物标签特征的药物标签特征提取网络。24、可选地,所述图谱特征提取模型包括双分支时序特征提取网络;25、利用图谱特征提取网络分别提取所述质谱数据中的离子特征以及核磁共振数据中的原子特征包括:26、将同一种药物在代谢过程中多个不同时间点的代谢产物的质谱图谱和核磁共振图谱分别输入所述双分支时序特征提取网络,分别得到所述质谱数据的时序特征和所述核磁共振数据的时序特征,以及每一时序下对应的所述离子特征和所述原子特征。27、根据第二方面,本技术实施例提供了一种药物代谢产物识别方法,包括:将待识别药物的代谢产物数据输入至所述权利要求1-6任意一项所述的药物代谢产物特征提取模型训练方法训练的特征提取模型提取待识别药物的代谢产物数据中的融合分子特征、第一重构分子特征和第二重构分子特征;将所述融合分子特征、所述第一重构分子特征和所述第二重构分子特征输入训练好的药物代谢产物识别模型,得到药物代谢产物识别结果,其中,所述药物代谢产物识别模型基于融合分子特征、第一重构分子特征和第二重构分子特征作为输入,将代谢产物信息作为输出构建的训练集训练得到的。28、可选地,药物代谢产物识别方法还包括:获取受体代谢酶特征;将所述代谢酶特征、所述融合分子特征、所述第一重构分子特征和第二重构分子特征输入至所述药物代谢产物识别模型,得到所述待识别药物的代谢产物,其中,在构建所述药物代谢产物识别模型时,将所述训练集按照不同个体的代谢酶特征对所述训练集划分为多个子训练集,利用所述子训练集在对所述识别模型进行训练,直至模型收敛。。29、根据第三方面,本技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,所述存储器,用于存储计算机程序;所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行第一方面中任一项所述的药物代谢产物特征提取模型训练方法和/或上述第二方面描述的药物代谢产物识别方法。30、根据第四方面,本技术实施例提供了一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行第一方面中任一项所述的药物代谢产物特征提取模型训练方法和/或上述第二方面描述的药物代谢产物识别方法。31、本技术通过获取多组药物的代谢产物的质谱数据和核磁共振数据构建训练集,所述训练集包括具有药物标签的质谱数据和核磁共振数据;利用图谱特征提取网络分别提取所述质谱数据中的离子特征以及核磁共振数据中的原子特征;将所述离子特征和所述原子特征分别输入第一生成器生成融合分子特征;利用第一判别器对所述第一生成器进行至少一轮次的第一对抗学习,直至所述融合分子特征与所述代谢产物对应的原分子特征的第一相似度大于第一预设相似度,以使所述第一生成器学习所述原分子特征与所述离子特征和所述原子特征之间的融合映射关系;将所述离子特征和所述原子特征输入第二生成器分别生成所述离子特征对应的第一重构分子特征和所述原子特征对应的第二重构分子特征;利用第二判别器分别对所述第二生成器进行至少一轮次的第二对抗学习,直至所述第一重构分子特征和所述第二重构分子特征分别与所述原分子特征的第二相似度大于第二预设相似度,以使所述第二生成器分别学习所述离子特征与所述原分子特征之间的第一映射关系和所述原子特征与所述原分子特征之间的第二映射关系以得到所述质谱数据和所述核磁共振数据的融合特征,将质谱数据和所述核磁共振数据进行整合,利用它们之间的互补性。核磁共振数据可以提供化合物的结构和组成信息,而质谱数据以提供化合物的分子量和离子碎片信息。通过第一生成器对两种数据中提取的分子语义信息进行融合,进而对两种数据的优势进行互补。采用相第二生成器分别利用离子特征和原子特征分别生成第一重构分子特征和第二重构分子特征,不能能够学习到离子特征与所述原分子特征之间的第一映射关系和所述原子特征与所述原分子特征之间的第二映射关系,还可以从第一重构分子特征和第二重构分子特征中筛选质谱数据和核磁共振数据的共性特征,以及质谱数据和核磁共振数据之间的特异性特征。因此,通过对抗学习,充分两种数据之间的互补性,不仅能够得到更为全面的化合物性质和结构数据,以更为全面的进行代谢产物的识别。在进行识别时能够获得药物代谢产物的全面信息,包括相对分子量、分子式、官能团、连接方式和三维构象等。这种综合分析方法使得结果具有很强的解释性,能够更准确地预测新药的药代动力学、药效学特性和不良反应。

药物代谢产物特征提取模型训练方法及其识别方