一种结合基于L21约束的图矩阵分解和网络投影融_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种结合基于L21约束的图矩阵分解和网络投影融

发布日期:2024-08-22 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种结合基于L21约束的图矩阵分解和网络投影融
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及机器学习与生物基因结合,具体为一种结合基于l约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法。、mirna是一种常见于真核细胞的rna分子,与人体内的许多疾病有着关联,例如,血小板mir-a-p可以抑制vasp的表达,而mir-a-p的降低会导致冠状动脉疾病(cad)...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及机器学习与生物基因结合,具体为一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法。背景技术:1、mirna是一种常见于真核细胞的rna分子,与人体内的许多疾病有着关联,例如,血小板mir-199a-5p可以抑制vasp的表达,而mir-199a-5p的降低会导致冠状动脉疾病(cad)患者的氯吡格雷血小板反应性高。在针对糖尿病肾病(dkd)的研究中,发现mirna-615-3p可以用作评估dkd进展的新型生物标志物,并参与dkd的炎症和纤维化过程。通过已有的mirna-疾病关联预测潜在的未知关联,可以深入了解这些疾病的分子机制,揭示疾病的发病机制,为临床诊断和监测提供更多选择,提高治疗的成功率。但是,通过传统的生物实验来确定mirna与疾病的关联需要耗费极大的人力和物力,因此人们开始应用高效且高精度的计算方法来预测潜在的mirna-疾病关联。现今众多的mirna-疾病预测模型,大体可以分为三种大类:(1)基于机器学习的方法(2)基于生物网络的方法。(3)基于矩阵分解的方法。2、基于机器学习的方法通常是假设相似的mirna(疾病)可能与同一疾病(mirna)存在关联,通过已知的mirna-疾病关联和mirna(疾病)的相似性来预测到新的mirna-疾病关联。然而,由于现存的数据库上没有关于负样本信息,大多数机器学习方法严重依赖已知的标签样本,而负样本在实际情况下很难获得,因此在面对潜在的负样本分类时存在严重偏差导致预测性能受限。3、第二类是基于构建生物网络模型来预测mirna与疾病关联。这一类方法不需要使用负样本,通常是通过整合不同的生物信息数据来构建异构网络,比如使用mirna-疾病关联网络,mirna相似性网络,疾病相似性网络,基因相似性网络等结合在一起形成新的异构网络,然后在新的异构网络上使用随机游走、图传播等方法来进行mirna与疾病关联的预测。这类方法需要不同的生物信息子网络来构建新的异构网络结构,这限制了模型的灵活性,并且引入其他的生物信息可能也会在模型中产生额外的噪声,这将影响了最终的预测性能4、第三种方法使用矩阵分解方法来预测mirna与疾病关联。这类方法的主要思想是,将mirna-疾病关联网络进行矩阵分解,形成两个低维矩阵,从而挖掘潜在的mirna-疾病关联信息。与其他两种方法相比,矩阵分解方法不需要负样本的参与,且不需要引入新的生物信息数据,不会有新的噪声产生。然而,现在的矩阵分解方法中,通常只考虑了高维原始矩阵的噪声问题,没有考虑到分解后的低维矩阵的噪声问题,影响了预测结果的准确性;除此之外,在矩阵分解的过程中存在着随机性,会不可避免的丢失原始矩阵中的部分网络拓扑信息。。5、通过已有的mirna-疾病关联预测潜在的未知关联,可以深入了解这些疾病的分子机制,揭示疾病的发病机制,为临床诊断和监测提供更多选择,提高治疗的成功率。但是,通过传统的生物实验来确定mirna与疾病的关联需要耗费极大的人力和物力。因此,发明一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法。技术实现思路1、鉴于上述和/或现有一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法中存在的问题,提出了本发明。2、因此,本发明的目的是提供一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法,能够解决上述提出现有的问题。3、为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:4、一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法,其包括具体步骤如下:5、s1:获取mirna-疾病的邻接矩阵y,通过mirna-疾病邻接矩阵来描述二者的关联关系;6、s2:通过医学主题词mesh计算出疾病语义相似性ssd,通过cui lab上获得mirna功能相似性ssm,通过邻接矩阵y分别计算出mirna的gip核相似性gm和疾病gip核相似性gd,随后得到综合相似性ms和ds;7、s3:在图矩阵分解中,加入基于l21范数设计的疾病相似性约束项和mirna相似性约束项,计算得到初始关联矩阵y*;8、s4:分别利用mirna/疾病相似性矩阵和s3得到的初始关联矩阵y*计算得到mirna/疾病的网络一致性投影矩阵nm和nd,然后将nm和nd融合回初始得分矩阵y*中,得到最终得分矩阵y'。9、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s1中获取mirna-疾病的邻接矩阵y的具体步骤为:从hmdd v2.0中下载mirna-疾病关联矩阵,并且在通过筛选后,获得了495种mirna与383种疾病之间的5430种临床和实验验证的mirna-疾病关联,其已知的mirna-疾病关联矩阵用y∈rs×t来表示,若mirna mi与疾病dj存在着关联,则对应y(i,j)为1,否则为0。10、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中获取疾病语义相似性ssd的具体步骤为:用医学主题词mesh来计算疾病语义相似度,用有向无环图dag来表示疾病之间的关系,疾病d的无环图dag表示为dag(d)=(d,t(d),e(d)),其中t(d)表示包含d本身及其祖先节点的节点集,e(d)表示相关边集,包括从父节点到其子节点的边,其疾病d的语义得分公式为:11、12、其中dd(t)疾病d的祖先节点t的语义贡献值,公式如下:13、14、其中δ是语义贡献因子,且δ设置为0.5,其疾病di和疾病dj之间语义相似性得分定义如下:15、16、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中获取mirna功能相似性ssm的具体步骤为:假设功能相似性的mirna往往与表型相似性的疾病有关联性,反之亦然,能够计算出mirna功能相似性,在http://www.cuilab.cn/files/images/cuilab/misim.zip中下载mirna功能相似性数据,同样的,构建了矩阵ssm∈rs×s来存储mirna功能相似性,其中ssm(mi,mj)是mirnami和mirnamj之间的功能相似性得分。17、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中计算mirna高斯相互作用谱核相似性gm的具体步骤为:径向基函数用于创建高斯相互作用谱gip相似性,作为测量mirna和疾病相似性的另一种方法,mirna之间的gip核相似性能够由下面式子得到:18、gm(mi,mj)=exp(-γ'||y(i,:)-y(j,:)||2)19、20、其中gm表示mirna的gip核相似性,内核带宽由γ'控制,能够通过对原始带宽进行归一化来确,γ简单的设置为1。21、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中疾病高斯相互作用谱核相似性gd的计算方式与mirna高斯相互作用谱核相似性gm的计算方式相同。22、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中mirna综合相似性ms的具体步骤为:为了更加准确获取mirna与疾病的相似度量,分别将疾病语义相似性与疾病gip核相似性、mirna功能相似性与mirna gip核相似性进行整合;23、其mirna整合相似性的具体操作为:当存在mirna功能相似性,值为ssm(mi,mj),否则为gm(mi,mj),mirna综合相似性ms的公式如下:24、25、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s2中疾病综合相似性ds的计算方式与mirna综合相似性ms的计算方式相同。26、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s3的具体步骤为:在图正则化矩阵分解的基础上,设计了基于l21范数的疾病相似性约束和mirna相似性约束项,公式如下:27、28、其中,u∈rs×k和v∈rt×k是由y生成的低维矩阵,λ1、λ2和λ3是正则化参数,λ4和λ5是约束项的参数,||vvt-ds||2,1和||uut-ms||2,1分别是疾病和mirna的l21相似性约束项,||vvt-ds||2,1=tr((vvt-ds)h1(vvt-ds)t),||uut-ms||2,1=tr((uut-ms)h2(uut-ms)t),其中h1和h2是两个对角矩阵,其中h1的第i个对角元素的值为h2的第i个对角元素的值为29、随后根据矩阵的迹性质,将公式转换为:30、31、由于目标函数并不是凸的,所以使用迭代更新算法来计算局部最小值,因而使用拉格朗日乘子法和karush-kuhn-tucker条件来优化目标函数,拉格朗日函数f为:32、33、对u和v的偏导数为:34、35、36、最后,得到u和v的更新规则:37、38、39、根据上式更新矩阵u和v,直到收敛或者达到迭代的上限,然后得到初始得分矩阵y*=uvt。40、作为本发明所述的一种结合基于l21约束的图矩阵分解和网络投影融合的mirna与疾病关联预测方法的一种优选方案,其中:所述s4的具体步骤为:mirna的投影矩阵计算公式为:41、42、其中,msi是mirna相似性矩阵ms的第i行,表示mirnami与所有mirna的相似性,表示矩阵y*的第j列,表示疾病dj与所有mirna的关联性,nm是相似性矩阵ms和初始得分矩阵y*计算出的网络投影矩阵,同样的,能够计算出网络投影矩阵nd:43、44、其中,dsj是疾病相似性矩阵ds的第j列,表示疾病dj与所有疾病的相似性,表示矩阵y*的第i行,表示mirnamj与所有疾病的关联性,nd是相似性矩阵ds和初始得分矩阵y*计算出的网络投影矩阵;45、最后,通过网络投影融合方法,将mirna/疾病网络投影矩阵融合回初始得分矩阵y*中,以弥补丢失的网络拓扑信息,公式如下:46、47、其中y'是最终得分矩阵,α∈(0,1)表示权重参数。48、与现有技术相比:49、本发明设计了l21相似性约束项加入到矩阵分解中(l21sgmf),有效的抑制了低维矩阵中的噪声,然后在npfm中将mirna/疾病相似性网络和初始得分矩阵融合在一起从而弥补分解过程中原始数据丢失的网络拓扑信息,使最终预测mirna-疾病的关联更加准确。

一种结合基于L21约束的图矩阵分解和网络投影融