用于对熔解曲线进行聚类以识别基因型的方法与_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

用于对熔解曲线进行聚类以识别基因型的方法与

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


用于对熔解曲线进行聚类以识别基因型的方法与
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本公开涉及用于对熔解曲线进行基因型分型的方法,特别地涉及用于自动地对熔解曲线进行聚类以改善熔解曲线的基因型分型的方法。、聚合酶链式反应(pcr)已成为生物医学研究、疾病监测和诊断中普遍存在的工具。熔解曲线分析同样已成为通常在pcr之后执行的用于识别dna基因型的常用工具。熔解曲线分析对双链...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本公开涉及用于对熔解曲线进行基因型分型的方法,特别地涉及用于自动地对熔解曲线进行聚类以改善熔解曲线的基因型分型的方法。背景技术:1、聚合酶链式反应(pcr)已成为生物医学研究、疾病监测和诊断中普遍存在的工具。熔解曲线分析同样已成为通常在pcr之后执行的用于识别dna基因型的常用工具。熔解曲线分析对双链dna在加热期间的解离特征进行评定。特别地,与双链dna结合的荧光染料通常随着温度增加而失去荧光,并且表现出与dna的有效解离一致的荧光减少。因为不同的基因型在不同的温度处解离,所以不同的基因型因此具有带有不同轮廓的熔解曲线。这种有效解离在其处发生的温度通常通过识别在熔解曲线的负一阶导数中形成的峰来查明。因此,具有相似特征(诸如峰)的负一阶导数可指示曲线属于相同的基因型。因此,对熔解曲线(以及特别地其负一阶导数)的分析可用于通过将相似的曲线分组在一起来对测定进行基因型分型。2、虽然存在用于基于熔解曲线分析来进行此类基因型分型的方法,但先前的方法具有局限性。例如,当对各种各样的基因型(包括带有大量基因型的测定和/或其中熔解曲线的质量不一致的情况)进行处理时,现有方法的有效性是有限的。因此,需要一种用于在带有大量基因型的测定中和/或在熔解曲线的质量不一致的情况下对熔解曲线进行基因型分型的自动化方法。技术实现思路1、本公开提供了用于对熔解曲线进行聚类以改善熔解曲线基因型分型的新颖方法。通过以下来执行该方法:对熔解曲线进行处理,通过对曲线进行比较来编译差值矩阵,基于差值矩阵来编译聚类矩阵,对聚类矩阵进行过滤,以及基于经过滤的聚类矩阵来识别基因型。2、一方面,提供了一种用于对多条熔解曲线进行基因型分型的自动化方法。熔解曲线可包括在温度范围内的荧光测量结果。该方法包括:通过计算该多条熔解曲线中的每一条在温度范围内的负一阶导数来生成多条经处理的熔解曲线。该方法进一步包括:基于经处理的熔解曲线,通过针对经处理的熔解曲线中的每一条计算在温度范围内给定的经处理的熔解曲线与其他经处理的熔解曲线中的每一条之间的绝对差值之和来编译第一差值矩阵。该方法进一步包括:基于第一差值矩阵,通过针对第一差值矩阵的每一列对在温度范围内的每个行向量求和来编译第二差值矩阵。该方法进一步包括:基于第二差值矩阵来编译初始聚类矩阵,其中初始聚类矩阵中的每一行识别初始聚类的集中的初始聚类。该方法包括:将初始聚类矩阵过滤成包括经过滤的初始聚类的集的经过滤的初始聚类矩阵,其中经处理的熔解曲线中的每一条被分配给单个经过滤的初始聚类。该方法进一步包括:计算经过滤的初始聚类矩阵中的每个经过滤的初始聚类中的峰的数量和每个峰的平均熔解温度。该方法进一步包括:将具有相同数量的峰和在指定的温度阈值内的平均熔解温度的经过滤的初始聚类相组合以编译最终聚类矩阵,以及基于最终聚类矩阵来识别该多条熔解曲线中的每一条的基因型。3、在一些实施例中,通过执行k-均值聚类来编译初始聚类矩阵。例如,初始聚类矩阵的每一行可包括:第一列,其识别第一经处理的熔解曲线;第二列,其识别带有距第一列的第一经处理的熔解曲线的最小非零距离的第二经处理的熔解曲线;以及后续列,其识别在带有第一列的第一经处理的熔解曲线的聚类内的另外的经处理的熔解曲线。可基于第二差值矩阵来确定最小非零距离,并且可基于聚类的质心与第一经处理的熔解曲线之间的距离来识别聚类。4、在一些实施例中,对初始聚类矩阵进行过滤包括:从初始聚类矩阵去除重复行。在一些实施例中,对初始聚类矩阵进行过滤进一步包括:将含有共同的经处理的熔解曲线的相交聚类相组合。例如,将相交聚类相组合可包括以下步骤:(a)在第一遍中识别初始聚类的集中含有共同的经处理的熔解曲线的初始聚类,(b)将在步骤(a)中识别的聚类中的每一个相组合,(c))在第二遍中识别含有共同的经处理的熔解曲线的任何其余聚类并且将所述其余聚类相组合,以及(d)去除含有共同的经处理的熔解曲线的初始聚类,使得经处理的熔解曲线均不存在于多于一个经过滤的初始聚类中。在一些实施例中,对初始聚类矩阵进行过滤包括:识别带有重复的经处理的熔解曲线的聚类,并且去除所述重复。5、在一些实施例中,对初始聚类矩阵进行过滤包括以下步骤:(i)基于聚类的最大信号与聚类阈值的比较来识别负聚类,以及(ii)合并在步骤(i)中识别的任何负聚类。例如,识别负聚类可包括:确定给定的聚类中的最大荧光值与带有最高荧光的聚类中的最大荧光的比率,以及将在步骤(aa)处确定的比率与聚类阈值进行比较。例如,聚类阈值可以为0.1。6、在一些实施例中,对初始聚类矩阵进行过滤还可包括:识别包括这样的峰的聚类,该峰小于其他聚类中的每一个的峰,将在步骤(iii)中识别的聚类中的经处理的熔解曲线与聚类阈值进行比较,以及将小于聚类阈值的经处理的熔解曲线中的任何经处理的熔解曲线设定为负的经处理的熔解曲线,并且从聚类去除所述负的经处理的熔解曲线。7、在一些实施例中,指定的温度阈值可以为1℃。8、在一些实施例中,可确定质量度量。例如,该方法还可包括:根据以下公式来确定与所识别的基因型中的每一个相关联的质量度量:9、10、其中“组_曲线”包括给定的聚类内的熔解曲线组。又如,该方法还可包括:根据以下公式来确定与聚类内的每条经处理的熔解曲线相关联的质量度量:11、其中“f”表示给定的经处理的熔解曲线。12、在一些实施例中,使用聚类技术来编译初始聚类矩阵。例如,可通过执行分层聚类、模糊c均值聚类、均值漂移聚类、基于密度的空间聚类和高斯混合模型中的至少一者来编译初始聚类矩阵。13、另一方面,提供了用于熔解曲线的自动化基因型分型的系统。该系统可包括至少一个数据处理器。该系统可进一步包括存储指令的至少一个存储器,该指令在由该至少一个数据处理器执行时引起包括以下的操作:通过计算该多条熔解曲线中的每一条在温度范围内的负一阶导数来生成多条经处理的熔解曲线,基于经处理的熔解曲线,通过针对经处理的熔解曲线中的每一条计算在温度范围内的给定的经处理的熔解曲线与其他经处理的熔解曲线中的每一条之间的绝对差值之和来编译第一差值矩阵。操作可进一步包括:基于第一差值矩阵,通过针对第一差值矩阵的每一列对在温度范围内的每个行向量求和来编译第二差值矩阵。操作可进一步包括:基于第二差值矩阵来编译初始聚类矩阵,其中初始聚类矩阵中的每一行识别初始聚类的集中的初始聚类。操作可进一步包括:将初始聚类矩阵过滤成包括经过滤的初始聚类的集的经过滤的初始聚类矩阵,其中经处理的熔解曲线中的每一条被分配给单个经过滤的初始聚类。操作可进一步包括:计算经过滤的初始聚类矩阵中的每个经过滤的初始聚类中的峰的数量和每个峰的平均熔解温度。操作可进一步包括:将具有相同数量的峰和在指定的温度阈值内的平均熔解温度的经过滤的初始聚类相组合以编译最终聚类矩阵,以及基于最终聚类矩阵来识别该多条熔解曲线中的每一条的基因型。技术特征:1.一种用于对包括在温度范围内的荧光测量结果的多条熔解曲线进行基因型分型的自动化方法,所述方法包括:2.根据权利要求1所述的方法,其中通过执行k-均值聚类来编译所述初始聚类矩阵。3.根据权利要求2所述的方法,其中所述初始聚类矩阵的每一行包括:4.根据权利要求2所述的方法,其中基于初始聚类的输入数量来执行所述k-均值聚类。5.根据权利要求1所述的方法,其中对所述初始聚类矩阵进行过滤包括:从所述初始聚类矩阵去除重复行。6.根据权利要求5所述的方法,其中对所述初始聚类矩阵进行过滤进一步包括:将含有共同的经处理的熔解曲线的相交聚类相组合。7.根据权利要求6所述的方法,其中将相交聚类相组合包括以下步骤:8.根据权利要求5所述的方法,其中对所述初始聚类矩阵进行过滤进一步包括:识别带有重复的经处理的熔解曲线的聚类,并且去除所述重复。9.根据权利要求5所述的方法,其中对所述初始聚类矩阵进行过滤进一步包括以下步骤:10.根据权利要求9所述的方法,其中识别负聚类包括:11.根据权利要求10所述的方法,其中所述聚类阈值为0.1。12.根据权利要求9所述的方法,其中对所述初始聚类矩阵进行过滤进一步包括:13.根据权利要求1所述的方法,其中所述指定的温度阈值为1℃。14.根据权利要求1所述的方法,其进一步包括:根据以下公式来确定与所识别的基因型中的每一个相关联的质量度量:15.根据权利要求1所述的方法,其进一步包括:根据以下公式来确定与聚类内的每条经处理的熔解曲线相关联的质量度量:16.根据权利要求1所述的方法,其中通过执行分层聚类、模糊c均值聚类、均值漂移聚类、基于密度的空间聚类和高斯混合模型中的至少一者来编译所述初始聚类矩阵。技术总结本公开描述了用于对熔解曲线进行基因型分型的自动化方法。对熔解曲线进行处理并且基于经处理的矩阵来编译差值矩阵。将所述差值矩阵用于编译聚类矩阵,并且对所述聚类矩阵进行过滤以确定用于对所述熔解曲线进行基因型分型的聚类。技术研发人员:R·柯尼克受保护的技术使用者:豪夫迈·罗氏有限公司技术研发日:技术公布日:2024/8/16

用于对熔解曲线进行聚类以识别基因型的方法与