构建目标蛋白的目标口袋结构的方法、装置及应
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本申请涉及人工智能与药物发现,尤其涉及构建目标蛋白的目标口袋结构的方法、目标蛋白结合分子预测方法、目标蛋白结合分子、相关装置、计算机程序产品、计算设备以及计算机可读存储介质。、p是一系列被称为肿瘤抑制蛋白(也称为p蛋白或p肿瘤蛋白)的同源异构蛋白的统称。由tp(人体)及trp(老鼠)基因编... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本申请涉及人工智能与药物发现,尤其涉及构建目标蛋白的目标口袋结构的方法、目标蛋白结合分子预测方法、目标蛋白结合分子、相关装置、计算机程序产品、计算设备以及计算机可读存储介质。背景技术:1、p53是一系列被称为肿瘤抑制蛋白(也称为p53蛋白或p53肿瘤蛋白)的同源异构蛋白的统称。由tp53(人体)及trp53(老鼠)基因编码。该蛋白是最早发现的肿瘤抑制基因所编码的蛋白之一。p53蛋白能调节细胞周期,促使细胞出现凋亡或细胞衰老(cellsenescence)等现象,从而避免细胞癌变发生。p53蛋白能保持基因组的稳定性,避免或减少突变的发生。因此被称为基因组守护者。2、在当前癌症研究领域,p53蛋白作为抑癌基因发挥着关键作用。然而,突变引起的结构变化导致p53失去正常的生理功能,限制了其抑制癌症细胞生长的能力。尽管目前对p53的突变亚型,如y220c和l1/s3口袋等进行了广泛的研究,但现有的研究主要集中在单一突变亚型的激活上,对于更广泛、更深入的探索尚显不足。此外,p53的结构复杂性为研究工作带来了极大的挑战。其高度的动态性和多样的突变亚型使得口袋的准确识别和描述变得异常困难,影响了对新稳定口袋的准确性和全面性的理解。3、具体来说,p53蛋白具有高度的结构动态性,这使得通过传统实验技术难以完全捕捉其在不同结构状态下的变化。x射线晶体学和核磁共振等方法可能无法提供足够的空间分辨率,限制了对p53结构动态性的全面理解,尤其是在寻找新的稳定口袋时。4、另一方面,口袋的识别和计算模型也充满了不确定性。在寻找p53蛋白的其他稳定口袋方面,传统的结构预测方法在口袋的识别和描述方面存在不确定性。口袋的形状和性质可能难以准确预测,而计算模型在预测新口袋时可能受到结构复杂性和相互作用多样性的限制,没有进一步的分子动力学模拟验证和实验验证以确认其准确性。5、因此,目前寻找p53稳定口袋的方法仍有待改进。技术实现思路1、本申请旨在解决现有问题的至少之一。为此,本申请提出了一种构建目标蛋白新的稳定口袋的方法。2、具体而言,本申请提供了如下技术方案:3、在本申请的第一方面,本申请提出了一种用于构建目标蛋白的目标口袋结构的方法。根据本申请的实施例,所述目标口袋结构用于预测所述目标蛋白的结合分子,所述方法包括:获取衍生自所述目标蛋白或其突变的多个晶体文件,所述多个晶体文件中的至少一个来源于所述目标蛋白的突变体;基于所述多个晶体文件,分别生成与所述晶体文件对应的候选口袋结构;选择所述多个晶体文件中的一个作为标准晶体文件,并将所述标准晶体文件所对应的候选口袋结构确定为基准口袋结构;基于所述基准口袋结构与其他所述候选口袋结构的相似度,对其他所述候选口袋结构进行筛选,以得到经过筛选的候选口袋;和将所述基准口袋结构与所述经过筛选的候选口袋汇总,得到所述目标口袋结构。上述方法能够用于准确构建目标蛋白的新口袋结构,同时提高了构建效率,有助于更准确地预测目标蛋白的结合分子。在小分子药物设计中,通过本方法获得目的蛋白的目标口袋结构,从而筛选结合该口袋结构的小分子药物。4、在本申请的第二方面,本申请提出了一种目标蛋白结合分子预测方法。根据本申请的实施例,所述方法包括:基于第一方面所述的方法构建目标蛋白的目标口袋结构;获取所述目标口袋结构对应的晶体文件,将所述晶体文件输入至经过训练的机器学习模型中,以获得目标蛋白结合分子。本方法能够准确、可靠预测目标蛋白结合分子,避免对目标蛋白和结合分子结合模式的猜测。在本申请的一些示例中,本方法可用于预测能够结合目标蛋白的小分子药物。5、在本申请的第三方面,本申请提出了一种目标蛋白结合分子。根据本申请的实施例,所述目标蛋白结合分子是通过第二方面方法预测获得。在本申请的一些示例中,前述目标蛋白结合分子可作为小分子药物用于疾病治疗或科学研究。6、在本申请的第四方面,本申请提出了一种用于构建目标蛋白的目标口袋结构的装置。根据本申请的实施例,所述装置包括:晶体文件获取单元,用于获取衍生自所述目标蛋白或其突变的多个晶体文件,所述多个晶体文件中的至少一个来源于所述目标蛋白的突变体;候选口袋结构生成单元,用于基于所述多个晶体文件,分别生成与所述晶体文件对应的候选口袋结构;基准口袋结构确定单元,用于选择所述多个晶体文件中的一个作为标准晶体文件,并将所述标准晶体文件所对应的候选口袋结构确定为基准口袋结构;候选口袋筛选单元,用于基于所述基准口袋结构与其他所述候选口袋结构的相似度,对其他所述候选口袋结构进行筛选,以得到经过筛选的候选口袋;和目标口袋获取单元,用于将所述基准口袋结构与所述经过筛选的候选口袋汇总,得到所述目标口袋结构。在本申请的一些示例中,前述装置能够高效地构建目标蛋白的目标口袋结构,具有高准确性和可操作性。基于获得的准确目标口袋结构可以实现目标蛋白的结合分子的准确预测。7、在本申请的第五方面,本申请提出了一种目标蛋白结合分子预测系统。根据本申请的实施例,所述系统包括:目标口袋构建装置,用于基于第三方面所述的装置构建目标蛋白的目标口袋结构;目标蛋白结合分子预测装置,用于获取所述目标口袋结构对应的晶体文件,将所述晶体文件输入至经过训练的机器学习模型中,以获得目标蛋白结合分子。在本申请的一些示例中,前述系统能够综合地预测目标蛋白的结合分子,具有高准确性、高效性和操作简便性。8、在本申请的第六方面,本申请提出了一种计算机程序产品。根据本申请的实施例,所述计算机程序产品包括:计算机指令;当部分或全部所述计算机指令在计算机上运行时,使得如本申请第一方面所述的用于构建目标蛋白的目标口袋结构的方法或第二方面所述的目标蛋白结合分子预测方法被执行。9、在本申请的第七方面,本申请提出了一种计算设备。根据本申请的实施例,所述计算设备包括:处理器和存储器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序以实现如本申请第一方面所述的用于构建目标蛋白的目标口袋结构的方法或第二方面所述的目标蛋白结合分子预测方法。10、在本申请的第八方面,本申请提出了一种计算机可读存储介质。根据本申请的实施例,所述计算机可读存储介质存储有计算机指令或程序,当计算机指令或程序在计算机上运行时,使得如本申请第一方面所述的用于构建目标蛋白的目标口袋结构的方法或第二方面所述的目标蛋白结合分子预测方法被执行。11、在本申请的一些示例中,前述计算机程序产品、计算设备以及计算机可读存储介质通过计算机指令的自动执行构建目标蛋白的目标口袋结构的方法或目标蛋白结合分子预测方法,实现了高效自动化,提高了效率和准确性。其次,基于指令的特性使得上述方法在不同环境中具有高度一致性和可靠性。12、本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。技术特征:1.一种用于构建目标蛋白的目标口袋结构的方法,其特征在于,所述目标口袋结构用于预测所述目标蛋白的结合分子,所述方法包括:2.根据权利要求1所述的方法,其特征在于,所述目标蛋白是p53蛋白,所述多个晶体文件分别衍生自所述p53蛋白的突变体。3.根据权利要求2所述的方法,其特征在于,所述晶体文件是对所述p53蛋白突变体晶体结构数据进行单链拆分后得到的pdb文件。4.根据权利要求1所述的方法,其特征在于,所述标准晶体文件是基于所述候选口袋结构的相似性确定的。5.根据权利要求4所述的方法,其特征在于,进一步包括:6.根据权利要求1所述的方法,其特征在于,所述筛选进一步包括下列的至少之一:7.根据权利要求6所述的方法,其特征在于,所述筛选进一步包括:8.根据权利要求1所述的方法,其特征在于,所述相似度是通过ratcliff-obershelp算法确定的。9.一种目标蛋白结合分子预测方法,其特征在于,包括:10.根据权利要求9所述的方法,其特征在于,所述机器学习模型选自深度学习模型。11.根据权利要求10所述的方法,其特征在于,所述深度学习模型选自pocket2mol分子生成模型。12.根据权利要求9所述的方法,其特征在于,进一步包括:基于药物相似性定量估计值和易合成性值对所述目标蛋白结合分子进行筛选。13.根据权利要求12所述的方法,其特征在于,进一步包括:基于分子动力学模拟方法,对所述目标蛋白结合分子进行进一步筛选。14.一种目标蛋白结合分子,其特征在于,所述目标蛋白结合分子通过权利要求9~13任一项所述方法预测获得。15.根据权利要求14所述的目标蛋白结合分子,其特征在于,所述目标蛋白结合分子具有式(i)所示结构,16.一种用于构建目标蛋白的目标口袋结构的装置,其特征在于,包括:17.一种目标蛋白结合分子预测系统,其特征在于,包括:18.一种计算机程序产品,其特征在于,包括:计算机指令;19.一种计算设备,其特征在于,包括:处理器和存储器;20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令或程序,当计算机指令或程序在计算机上运行时,使得如权利要求1~8任一项所述的用于构建目标蛋白的目标口袋结构的方法或权利要求9~13任一项所述的目标蛋白结合分子预测方法被执行。技术总结本申请提供了一种构建目标蛋白的目标口袋结构的方法、装置及应用。前述目标口袋结构用于预测所述目标蛋白的结合分子,前述方法包括:获取衍生自目标蛋白或其突变的多个晶体文件,多个晶体文件中的至少一个来源于目标蛋白的突变体;基于多个晶体文件,分别生成与晶体文件对应的候选口袋结构;选择多个晶体文件中的一个作为标准晶体文件,并将标准晶体文件所对应的候选口袋结构确定为基准口袋结构;基于基准口袋结构与其他候选口袋结构的相似度,对其他候选口袋结构进行筛选,以得到经过筛选的候选口袋;和将基准口袋结构与经过筛选的候选口袋汇总,得到目标口袋结构。上述方法能够用于准确、高效构建目标蛋白的新口袋结构。技术研发人员:吕佳芸,张明明,刘衍光,高琦,秦帅波,于宇受保护的技术使用者:杭州瑞普基因科技有限公司技术研发日:技术公布日:2024/8/16