一种基于RNN的无属性图的编解码图嵌入方法和系_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种基于RNN的无属性图的编解码图嵌入方法和系

发布日期:2024-08-21 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种基于RNN的无属性图的编解码图嵌入方法和系
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及图神经网络中的图嵌入方法领域,尤其涉及一种基于rnn的无属性图的编解码图嵌入方法。、图结构(graph)广泛存在于现实各种应用场景中。例如,在社交媒体中,用户之间的相互关系构成了一个庞大的社交图网络;在推荐系统中,用户与商品之间的购买、浏览、评分等行为可以被抽象为用户与商品之间的...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及图神经网络中的图嵌入方法领域,尤其涉及一种基于rnn的无属性图的编解码图嵌入方法。背景技术:1、图结构(graph)广泛存在于现实各种应用场景中。例如,在社交媒体中,用户之间的相互关系构成了一个庞大的社交图网络;在推荐系统中,用户与商品之间的购买、浏览、评分等行为可以被抽象为用户与商品之间的交互图。在互联网拓扑、交通网络、电子通信等绝大多数实际应用中,节点属性信息可能因隐私、数据不完整或不可用性等原因而缺失,无法直接应用于无节点属性的图分析,需要依赖图结构来分析节点之间的连接关系和拓扑结构,提取节点的邻域信息。在对无节点属性的图进行分析时,其先决条件是通过节点间的连接关系得到节点嵌入,生成一种可量化的编码,以标识图中节点的结构特征,进而应用于节点分类、链路预测和图分类等各种图分析和图挖掘任务。2、图嵌入(graph embedding)作为一种将图中的节点映射到低维向量空间中的技术,可对无节点属性的图进行编码,量化节点间的连接关系和相似性,得到节点的结构特征,捕捉图中的结构信息。3、在以往的研究中,图嵌入方法可划分为两类:一类是基于节点属性和图结构的图嵌入方法,另一类是基于图结构的图嵌入方法。基于节点属性和图结构的图嵌入方法以gcn和graphsage为代表,以节点属性特征和图结构作为输入,通过聚合邻居节点的信息得到节点的嵌入向量。然而,这类方法依赖于节点的属性信息,并不适用于无节点属性的图数据。基于图结构的图嵌入方法以deepwalk和node2vector为代表,以图结构信息为基础,构建节点嵌入间的相似性损失函数,实现无监督学习(encoder-loss)。这类方法主要关注局部的节点相似性,未能完全考虑整体图的结构特征。此外,这类方法通常依赖于一些超参数的设置,如随机游走的步数和采样数量,不同的参数选择会导致不同的嵌入结果。技术实现思路1、本发明针对现有基于图结构的图嵌入方法依赖于节点的属性信息,并不适用于无节点属性的图数据的问题,提出一种基于rnn的无属性图的编解码图嵌入方法,所述方法包括:2、s1:将拓扑结构中以节点v为中心的二跳子图作为节点v的邻域子图v-graph,并将邻域子图对应的bfs逆序作为训练样本;3、s2:构建双rnn结构的编码器encoder,根据所述基于时序模型rnn的编码器encoder对节点v的邻域子图v-graph进行编码,并获取节点v的结构特征v-emb;4、s3:构建双rnn结构的解码器decoder,根据所述双rnn结构的解码器decoder将节点v的结构特征v-emb进行重构,获取重构的回邻域子图。5、进一步的,还提出一种优选方式,所述步骤s2中双rnn结构的编码器encoder由node rnn和edge rnn构成。6、进一步的,还提出一种优选方式,所述步骤s2包括:7、将节点序列输入至node rnn中,并将node rnn作为编码器encoder的基本架构;8、将邻域子图v-graph进行bfs节点排序的逆向结果作为编码器encoder的输入;9、利用每个节点的邻域特征作为该节点的输入特征h,并通过edge rnn进行提取当前节点的邻域特征;10、将节点v与bfs节点排序的逆向结果的邻接向量为输入时序,利用edge rnn得到节点v的结构特征。11、进一步的,还提出一种优选方式,所述节点的邻域特征由该节点与其他节点的连接状态以及该节点的相邻节点排序rank决定,rank越大对该节点的邻域特征的影响越大。12、进一步的,还提出一种优选方式,所述将节点v与bfs节点排序的逆向结果的邻接向量为输入时序,利用edge rnn得到节点v的结构特征具体为:13、14、其中,vi为节点,emb为结构特征,表示节点的邻域特征。15、进一步的,还提出一种优选方式,所述节点的邻域特征由节点的邻接向量序列输入edge rnn得到,具体为:16、17、其中,是由节点排序中的第k个节点与组成的非0即1的邻接向量序列,其中:18、19、进一步的,还提出一种优选方式,所述步骤s3中双rnn结构的解码器decoder由node rnn结构和edge rnn结构构成,将vi-emb作为node rnn的输入,用以生成新的节点和特征具体运算公式如下:20、21、将新生成节点的特征和开始符号sos作为edge rnn的输入,对新生成节点与已有节点进行连接生成判别,得到具体运算公式如下:22、23、基于同一发明构思,本发明还提出一种基于rnn的无属性图的编解码图嵌入系统,所述系统包括:24、邻域子图构建单元,用于将拓扑结构中以节点v为中心的二跳子图作为节点v的邻域子图v-graph,并将邻域子图对应的bfs逆序作为训练样本;25、编码单元,用于构建双rnn结构的编码器encoder,根据所述基于时序模型rnn的编码器encoder对节点v的邻域子图v-graph进行编码,并获取节点v的结构特征v-emb;26、重构单元,用于构建双rnn结构的解码器decoder,根据所述双rnn结构的解码器decoder将节点v的结构特征v-emb进行重构,获取重构的回邻域子图。27、基于同一发明构思,本发明还提出一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行如上述任一项中所述的一种基于rnn的无属性图的编解码图嵌入方法。28、基于同一发明构思,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质用于储存计算机程序,所述计算机程序执行上述任一项所述的一种基于rnn的无属性图的编解码图嵌入方法。29、本发明的有益之处在于:30、本发明解决了现有基于图结构的图嵌入方法依赖于节点的属性信息,并不适用于无节点属性的图数据的问题。31、(1)本发明提出的一种基于rnn的无属性图的编解码图嵌入方法,使用encoder-decoder架构作为对无节点属性的图的编码方案,使得模型训练后的节点结构特征能够充分体现节点的邻域关系及上下文环境,强化了节点结构特征的表达能力,适用于无节点属性的图数据。32、(2)本发明提出的一种基于rnn的无属性图的编解码图嵌入方法,encoder使用时序模型rnn对图的层次结构进行编码,利用rnn的短期记忆特性,充分模拟节点上下文环境中节点层次对节点结构特征的影响,使得编码后的节点结构特征更符合图的层次结构。33、(3)本发明提出的一种基于rnn的无属性图的编解码图嵌入方法,decoder使用时序模型rnn进行图重构,利用rnn的循环机制和短期记忆特性,充分模拟节点邻域关系中节点的权重及节点间的关联度,使得重构后的图结构更符合原始图的邻域分布。34、本发明应用于互联网拓扑领域。

一种基于RNN的无属性图的编解码图嵌入方法和系