用于预测基因组谱分析成功的方法和系统与流程
发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370
申请号: | 申请日: | ||
公开(公告)号: | 公开(公告)日: | ||
发明(设计)人: | 申请(专利权)人: | ||
主分类号: | 分类号: | ||
代理公司: | 代理人: | ||
地址: | 国省代码: | ||
权利要求书: | 说明书: | ||
微信咨询: | 添加微信:543646或【点此在线咨询】 | 文件下载: | 【点此下载】请正确填写本页网址和接收邮箱 |
摘要: | 本公开通常涉及基因组谱分析方法和系统,并且更具体地涉及用于基于个体样品的分析前变量来预测对个体样品进行基因组谱分析的成功的方法和系统。、基因组谱分析(gp)是基于下一代测序(ngs)的方法,其允许在单次测定中分析一组基因(例如,数十到数百个基因),目的是检测可以诊断和/或预后疾病诸如癌症的... | ||
相关服务: | 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理 | ||
本公开通常涉及基因组谱分析方法和系统,并且更具体地涉及用于基于个体样品的分析前变量来预测对个体样品进行基因组谱分析的成功的方法和系统。背景技术:1、基因组谱分析(gp)是基于下一代测序(ngs)的方法,其允许在单次测定中分析一组基因(例如,数十到数百个基因),目的是检测可以诊断和/或预后疾病诸如癌症的基因组改变(例如,变体核酸序列)。例如,gp可用于检测已知驱动癌症生长的四种主要类别的基因组改变:碱基取代、插入和缺失、拷贝数改变(cna)以及重排或融合。2、尽管使用gp来识别疾病相关的基因组改变具有潜在的优势和已证明的成功,但扩大gp测试实施的各种挑战仍然存在。由医师提交样品的现有指南并未考虑可能影响进行gp的成功的分析前变量。因此,一种用于更准确地预测对特定样品成功进行gp的可能性的方法,在减少进行gp的时间和成本,以及改善gp测试结果对医疗保健决策和医疗保健结果的影响两者方面将是有利的。技术实现思路1、本文公开了用于基于与样品相关联的一组分析前变量来更准确地预测对特定样品成功进行基因组谱分析(gp)的可能性的方法和系统。在一些情况下,所公开的方法和系统对于基于与样品相关联的一组分析前变量来预测对特定样品成功进行全面基因组谱分析(cgp)的可能性尤其有用。该方法包括使用经过训练的模型来处理由医师或其他医疗保健提供者输入的样品的分析前数据,并输出使用该样品的gp测定将产生可靠结果的基于证据的预测。在一些情况下,例如,如果进行成功gp分析的预测可能性较低,则可能会建议在提交gp测试之前获取新样品。所公开的方法和系统在减少进行gp的时间和成本以及改善gp测试结果对医疗保健决策和医疗保健结果的影响方面是有利的。2、本文公开了用于对进行源自受试者的样品的基因组谱分析的成功可能性进行预测的方法,其包括:接收针对与样品相关联的多个分析前变量的数据;将接收到的数据应用于多变量模型,该多变量模型经训练以预测针对基因组谱分析测定的结果;基于应用的多变量模型,生成对进行样品的基因组谱分析的成功可能性的预测;以及使用一个或多个处理器报告对进行样品的基因组谱分析的成功可能性的预测。3、在一些实施例中,该方法进一步包括:基于对成功可能性等于或大于预定义阈值的预测,提供从来自受试者的样品获得的多个核酸分子;将一个或多个衔接子连接到来自多个核酸分子的一个或多个核酸分子上;从多个核酸分子中扩增一个或多个连接的核酸分子;从经扩增的核酸分子中捕获经扩增的核酸分子;通过测序仪对捕获的核酸分子进行测序以获得代表捕获的核酸分子并且与样品中的一个或多个亚基因组区间内的一个或多个基因座重叠的多个序列读段;以及通过一个或多个处理器,基于针对样品的序列读段,生成包括序列读段分析数据的基因组谱。4、在一些实施例中,该方法进一步包括:使用训练数据来训练多变量模型。在一些实施例中,训练数据包括源自针对从受试者收集的样品的临床研究数据的单变量分析的数据,该数据代表一系列的受试者年龄、受试者性别、诊断、疾病阶段、样品类型、样品收集点、样品收集方法、样品制备方法、样品保存方法、样品年龄、样品运输方法或其任意组合。在一些实施例中,训练数据进一步包括针对ecog状态、受试者治疗状态、样品中的肿瘤细胞密度、样品中的肿瘤细胞核含量、样品的组织表面积、样品中的组织基质、先前基因组谱分析测定结果或其任意组合的数据。5、在一些实施例中,多个分析前变量包括受试者年龄、受试者性别、诊断、疾病阶段、样品类型、样品收集点、样品收集方法、样品制备方法、样品保存方法、样品年龄、样品运输方法或其任意组合。在一些实施例中,用针对样品中的肿瘤细胞密度、样品中的肿瘤细胞核含量、样品的组织表面积、样品中的组织基质或其任意组合的数据来补充针对多个分析前变量的数据。6、在一些实施例中,多变量模型包括机器学习模型。在一些实施例中,机器学习模型包括监督学习模型。在一些实施例中,机器学习模型包括无监督学习模型。在一些实施例中,多变量模型包括逻辑回归模型、多元线性回归模型、随机森林模型、神经网络模型或深度学习模型。7、在一些实施例中,对成功可能性的预测包括二进制值、百分比或分数。8、在一些实施例中,该方法进一步包括:将预测的成功可能性与预定义阈值进行比较;以及基于对预测的成功可能性大于或等于预定义阈值的确定,输出来自受试者的样品适合于提供受试者的基因组谱的指示。9、在一些实施例中,该方法进一步包括:将预测的成功可能性与预定义阈值进行比较;以及基于对预测的成功可能性小于预定义阈值的确定,输出关于收集新样品而不是提交样品用于基因组谱分析的建议。在一些实施例中,该方法进一步包括:输出关于针对新样品的样品类型或样品收集点的建议。在一些实施例中,该方法进一步包括:输出关于针对要进行的替代的基于核酸测序的测试方法的建议。在一些实施例中,预定义阈值根据样品类型而变化。10、在一些实施例中,针对多个分析前变量的数据由用户经由显示装置上的图形用户界面(gui)输入。在一些实施例中,经由显示装置上的图形用户界面(gui)报告对进行样品的基因组谱分析的成功可能性的预测。在一些实施例中,图形用户界面(gui)显示在网络浏览器中。11、在一些实施例中,接收的针对多个分析前变量的数据包括针对样品类型的数据。在一些实施例中,多个分析前变量中的其余分析前变量是基于样品类型选择的。在一些实施例中,多变量模型是基于样品类型选择的。12、在一些实施方案中,样品包含组织活检样品、液体活检样品或正常对照。在一些实施方案中,样品是组织活检样品并且包含骨髓。在一些实施方案中,样品是液体活检样品并且包含血液、血浆、脑脊髓液、痰液、粪便、尿液或唾液。在一些实施方案中,样品为液体活检样品并且包括循环肿瘤细胞(ctc)。在一些实施方案中,样品是液体活检样品并且包含无细胞dna(cell-free dna,cfdna)、循环肿瘤dna(circulating tumor dna,ctdna)、或其任意组合。13、在一些实施例中,如果预测的成功可能性大于或等于预定义阈值,则该基因组谱分析被进行并用于诊断受试者的疾病或确认受试者的疾病的诊断。在一些实施例中,基因组谱分析还用于基于生物标志物状态确定针对疗法的资格。在一些实施方案中,疾病是癌症。在一些实施例中,该方法进一步包括:基于基因组谱分析的结果来选择用以向受试者施用的抗癌疗法。在一些实施例中,该方法进一步包括:基于基因组谱分析的结果来确定用以向受试者施用的抗癌疗法的有效量。在一些实施例中,该方法进一步包括:基于基因组谱分析的结果来向受试者施用抗癌疗法。在一些实施方案中,抗癌疗法包括化学疗法、放射疗法、免疫疗法、靶向疗法或手术。在一些实施例中,癌症为b细胞癌(多发性骨髓瘤)、黑色素瘤、乳腺癌、肺癌、支气管癌、结肠直肠癌、前列腺癌、胰腺癌、胃癌、卵巢癌、膀胱癌、脑癌、中枢神经系统癌、周围神经系统癌、食管癌、宫颈癌、子宫癌、子宫内膜癌、口腔癌、咽癌、肝癌、肾癌、睾丸癌、胆道癌、小肠癌、阑尾癌、唾液腺癌、甲状腺癌、肾上腺癌、骨肉瘤、软骨肉瘤、血液组织癌、腺癌、炎症性肌成纤维细胞瘤、胃肠道间质瘤(gist)、结肠癌、多发性骨髓瘤(mm)、骨髓增生异常综合征(mds)、骨髓增生性疾患(mpd)、急性淋巴细胞性白血病(all)、急性髓细胞性白血病(aml)、慢性髓细胞性白血病(cml)、慢性淋巴细胞性白血病(cll)、真性红细胞增多症、霍奇金淋巴瘤、非霍奇金淋巴瘤(nhl)、软组织肉瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、成骨性肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤文氏瘤、平滑肌肉瘤、横纹肌肉瘤、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、乳头状癌、乳头状腺癌、髓样癌、支气管源性癌、肾细胞癌、肝细胞瘤、胆管癌、绒毛膜癌、精原细胞瘤、胚胎性癌、维尔姆斯氏瘤、膀胱癌、上皮性癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、少突神经胶质瘤、脑膜瘤、成神经细胞瘤、视网膜母细胞瘤、滤泡性淋巴瘤、弥漫性大b细胞淋巴瘤、套细胞淋巴瘤、肝细胞癌、甲状腺癌、胃癌、头颈癌、小细胞癌、原发性血小板增多症、原因不明性髓样化生、高嗜酸性粒细胞增多综合征、系统性肥大细胞增多症、常见高嗜酸性粒细胞增多症、慢性嗜酸性粒细胞白血病、神经内分泌癌或类癌瘤。14、在一些实施例中,针对受试者的基因组谱分析包括获得来自全面基因组谱分析(comprehensive genomic profiling,cgp)测试、基因表达谱分析测试、癌症热点组测试、dna甲基化测试、dna片段化测试、rna片段化测试或其任意组合的结果。在一些实施例中,针对受试者的基因组谱分析进一步包括获得来自基于核酸测序的测试的结果。在一些实施例中,该方法进一步包括基于基因组谱分析结果选择抗癌剂、向受试者施用抗癌剂或应用抗癌治疗。15、本文还公开了系统,其包括:一个或多个处理器;以及与一个或多个处理器通信地耦连并被配置为存储指令的存储器,当该指令由一个或多个处理器执行时,使得该系统:接收针对与源自受试者的样品相关联的多个分析前变量的数据;将接收到的数据应用于多变量模型,该多变量模型经过训练以预测针对基因组谱分析测定的结果;基于应用的多变量模型,生成对进行样品的基因组谱分析的成功可能性的预测;并报告对进行样品的基因组谱分析的成功可能性的预测。16、在一些实施例中,该指令进一步使得系统:将预测的成功可能性与预定义阈值进行比较;以及基于对预测的成功可能性小于预定义阈值的确定,输出关于收集新样品而不是提交样品用于基因组谱分析的建议。在一些实施例中,针对多个分析前变量的数据由用户经由显示装置上的图形用户界面(gui)输入。在一些实施例中,经由显示装置上的图形用户界面(gui)报告对进行样品的基因组谱分析的成功可能性的预测。在一些实施例中,图形用户界面(gui)显示在网络浏览器中。17、本文公开了存储一个或多个程序的非暂时性计算机可读存储介质,该一个或多个程序包括指令,当该指令由系统的一个或多个处理器执行时,使得该系统:接收针对与源自受试者的样品相关联的多个分析前变量的数据;将接收到的数据应用于多变量模型,该多变量模型经过训练以预测针对基因组谱分析测定的结果;基于应用的多变量模型,生成对进行样品的基因组谱分析的成功可能性的预测;并报告对进行样品的基因组谱分析的成功可能性的预测。在一些实施例中,该指令进一步使得系统:将预测的成功可能性与预定义阈值进行比较;以及基于对预测的成功可能性小于预定义阈值的确定,输出关于收集新样品而不是提交样品用于基因组谱分析的建议。18、通过引用并入19、本说明书中提到的所有出版物、专利和专利申请都以全文引用的方式并入本文,所达到的程度如同每个单独的出版物、专利或专利申请都被具体地和单独地指出以全文引用的方式并入。如果文本的术语与并入的参考文献中的术语发生冲突,则以本文的术语为准。
- 上一篇:缝隙连接调节剂及其用于治疗年龄相关性黄斑变
- 下一篇:美容的汗液管理组合物的制作方法