一种微生物非对称关联网络的推断方法及装置_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种微生物非对称关联网络的推断方法及装置

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种微生物非对称关联网络的推断方法及装置
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本申请涉及微生物生态学领域,尤其涉及一种微生物非对称关联网络的推断方法及装置。、随着二代测序技术的发展,通过对微生物群落关系网络的构建,可以帮助了解各个微生物之间的关联。例如,由微生物物种的共出现模式可以推断编码成一个共出现网络。此网络中节点是otus,两种otus之间存在着边则意味着这两...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本技术涉及微生物生态学领域,尤其涉及一种微生物非对称关联网络的推断方法及装置。背景技术:1、随着二代测序技术的发展,通过对微生物群落关系网络的构建,可以帮助了解各个微生物之间的关联。例如,由微生物物种的共出现模式可以推断编码成一个共出现网络。此网络中节点是otus,两种otus之间存在着边则意味着这两种微生物在多个样本中以很高的频率一起出现。共出现网络已经被成功应用于土壤微生物,海洋微生物以及与人类健康有关的微生物的研究中。尽管共出现网络在揭示微生物之间直接或间接的功能联系方面具有显著优势,但它无法发现和揭示微生物群体中环境因子对微生物物种的非对称影响。这主要是因为共出现网络主要关注微生物之间的相互作用,而环境因子对微生物物种的影响往往较为复杂且难以捉摸。这种方法尽管适用于挖掘共出现或者共丰度变化的关系,但是不能解释为什么某种微生物会在群落中富集或者缺失,也不能回答微生物是如何彼此相互影响的或者受环境影响的。2、为了更全面地研究微生物群落中环境因子对微生物物种的影响,急需一种可以检测非对称关系的算法,以便于深入挖掘微生物群落中环境因子与微生物物种之间的相互作用机制,为微生物生态学研究提供有力支持。技术实现思路1、本发明提供了一种微生物非对称关联网络的推断方法及装置,解决了现有技术中利用共出现网络无法发现和揭示微生物群体中环境因子对微生物物种的非对称影响的技术问题。2、根据本发明的第一方面,提供了一种微生物非对称关联网络的推断方法,基于生物信息学算法实现,所述方法包括:3、获取多个微生物样本的otus的丰度数据,并将其整合形成otus丰度表格;4、对所述otus丰度表格中所有样本中出现次数比例少于一定阈值的otus进行过滤;5、获取微生物样本的环境因子测量值;6、对过滤后的otus和所述环境因子测量值进行二值化;7、对二值化后的otu与otu或者otu与环境因子进行两两布尔蕴含关系的推断;8、通过控制错误发现率fdr将推断出的两两布尔蕴含关系进行整合,得到样本中微生物之间以及微生物与环境因子之间布尔蕴含关系的网络。9、进一步的,所述获取多个微生物样本的otus的丰度数据,并将其整合形成otus丰度表格,包括:10、获取多个微生物样本的16s rrna测序数据,构建多个16s rrna的测序数据集;11、对所述多个16s rrna的测序数据集进行序列相似性聚类,并根据每个样本中每种otu的数目得到样本的otus的丰度数据;12、将不同宏基因组数据集聚类得到的otus丰度数据进行整合,形成otus丰度表格。13、进一步的,所述对过滤后的otus和所述环境因子测量值进行二值化,包括:14、将过滤后的otus的丰度值和环境因子测量值通过自适应的stepminer算法进行二值化为高和低。15、进一步的,所述将过滤后的otus的丰度值和环境因子测量值通过自适应的stepminer算法进行二值化为高和低,包括:16、对每一种otu在所有样本中的丰度值按非减的顺序进行排序;17、利用一个增加的阶跃函数对排序后的丰度值数据进行拟合,使得拟合值与原始数据之间的差异最小;18、所述stepminer算法用线性回归的方法对每一个潜在的阶跃位置进行评估,以得到最优位置;19、在每一个位置上,计算一个f统计量的值,该f统计量的值等于回归均方差除以拟合值的均方误差;20、具有最小p值的阶跃位置作为离散化的阈值,将大于所述离散化的阈值的丰度值置为1,即高;小于所述离散化的阈值的丰度值置为0,即低。21、进一步的,所述对二值化后的otu与otu或者otu与环境因子进行两两布尔蕴含关系的推断,包括:22、将二值化后的两个因子的值分别形成四种组合:低-低、低-高、高-低和高-高;23、对任意一个样本,根据其中这两个因子的丰度水平,将该样本放入这四种组合之一中;24、根据所有样本在这四种组合中出现的频次,构建列联表;25、利用两个对象的列联表,采用假设检验来检测布尔蕴含关系的存在。26、进一步的,所述假设检验包括以下两个阶段:27、检验四个组合中显著稀疏性的组合;28、根据稀疏性组合情况推断布尔蕴含关系。29、进一步的,所述检验四个组合中显著稀疏性的组合包括:30、当样本量小于第一阈值时,利用fisher精确检验的方法来检测得到出现的次数显著少于其他组合的组合;31、当样本量大于等于第一阈值时,利用类似卡方检验的方法来检测出现的次数显著少于其他组合的组合。32、进一步的,所述检验四个组合中显著稀疏性的组合还包括:33、将稀疏组合中出现的样本视为错误点并计算错误率的最大似然估计;34、根据所述最大似然估计进一步过滤掉假设检验得到的假阳性的情况。35、进一步的,所述根据稀疏性组合情况推断布尔蕴含关系包括:36、将otus的丰度值和环境因子的测量值分别随机打乱,然后在打乱后的数据上进行以上统计检验来确定布尔蕴含关系;37、重复以上两步n次,默认n=1000,则错误发现率fdr等于在随机数据集中发现的布尔蕴含关系数目的平均值除以在原始真实数据中发现的布尔蕴含关系数目;38、通过选定合适的错误发现率fdr的阈值,即可构建出布尔蕴含网络。39、根据本发明的第二方面,提供了一种微生物非对称关联网络的推断装置,基于生物信息学算法实现,所述装置包括:40、第一获取模块,用于获取多个微生物样本的otus的丰度数据,并将其整合形成otus丰度表格;41、预处理模块,拥有对所述otus丰度表格中所有样本中出现次数比例少于一定阈值的otus进行过滤;42、第二获取模块,用于获取微生物样本的环境因子测量值;43、数据处理模块,用于对过滤后的otus和所述环境因子测量值进行二值化;44、关系推断模块,用于对二值化后的otu与otu或者otu与环境因子进行两两布尔蕴含关系的推断;45、网络整合模块,用于通过控制错误发现率fdr将推断出的两两布尔蕴含关系进行整合,得到样本中微生物之间以及微生物与环境因子之间布尔蕴含关系的网络。46、与现有技术相比,本发明取得了如下优点及积极效果:47、1、本发明能够深入挖掘微生物群落中环境因子与微生物物种之间的相互作用机制,为微生物生态学研究提供有力支持。48、2、本发明提供了一种从布尔蕴含的角度出发检测群落中更加复杂的非对称逻辑关系,因此可以在微生物群落关系中回答部分的因果关系。49、3、相对现有方法,本发明的方法能够通过布尔蕴含网络的构建,更好的展示微生物群落中的调控关系。50、4、在检测布尔蕴含关系上,本发明的方法依赖于更加精确的检验,因此可以得到更好的功效。51、应当理解,技术实现要素:部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。

一种微生物非对称关联网络的推断方法及装置