一种基于异构图神经网络的可解释兵棋预测方法_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种基于异构图神经网络的可解释兵棋预测方法

发布日期:2024-09-02 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种基于异构图神经网络的可解释兵棋预测方法
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明属于智能兵棋推演,涉及一种基于异构图神经网络的可解释兵棋预测方法及系统。、现代兵棋是从普鲁士推出的战争游戏演变而来一种即时战略游戏(real-timestrategygame)。作为战争的简化模拟,其允许两方及以上的玩家参与。每方均扮演一方势力的指挥官,指挥一些作战单位,比如坦克、战...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明属于智能兵棋推演,涉及一种基于异构图神经网络的可解释兵棋预测方法及系统。背景技术:1、现代兵棋是从普鲁士推出的战争游戏演变而来一种即时战略游戏(real-timestrategygame)。作为战争的简化模拟,其允许两方及以上的玩家参与。每方均扮演一方势力的指挥官,指挥一些作战单位,比如坦克、战车、步兵等,运用博弈论、概率论与一些其他科学的方法,在兵棋规则内与敌方势力作战,进行模拟和推演,直至对局结束。最终以剩余作战单位种类和数量、战斗积分决定推演的胜者。2、目前在兵棋技术研究领域,出现了众多的研究方法和路径,现有技术在提升兵棋智能化水平上取得了显著进展,尤其在作战环境感知,意图识别判断,行动预测等关键领域进行了精细的认知建模,确保了战术模拟的实时性和逼真度。同时将深度学习和机器学习等领域的模型运用在兵棋数据挖掘上,不仅揭示了作战单元的性能和战术规律,而且实现了战术机动的自主决策和行动优化,极大提升了决策的适应性和灵活性。在复盘分析和轨迹聚类方面,实体轨迹聚类算法的创新为战场态势的理解提供了新维度,能够从纷繁复杂的轨迹数据中提取出关键信息。在作战方案评估方面,结合深度学习模型建立的评估框架克服了传统方法在动态对抗及主观因素影响方面的不足,为战术决策提供了更为科学的量化标准。整体来看,现有技术从不同的维度去捕捉作战态势,提供了多元的战术决策知识,为未来兵棋的战术训练与决策支持开辟了新的道路。3、目前在现有技术中,主要存在以下问题:1)当前兵棋智能化的相关研究仍存在不足:从方法论的角度,目前实现兵棋智能化的主流方法大致分为:知识驱动的方法,数据驱动的方法,以及知识和数据混合驱动的方法。知识驱动通过人工编辑将军事专家的指挥决策经验转化为计算机可识别的结构化知识,通过有限状态机等方式实现兵棋ai的智能决策。虽然无需训练,但是高度依赖人类专家,导致领域知识建模效率低,对未知环境适应能力较差。数据驱动方法则基于大量数据及环境的交互,通过强化学习等方式不断学习训练决策模型,虽然自动化程度高,但学习代价高昂,模型解释性较差。2)复杂态势表达困难:现代计算机兵棋系统由于推演环境动态复杂、规则多样、随机性强等因素,导致其态势难以用简单的结构化数据进行表达,现有方法大多对态势信息做了极大简化,导致其信息表达不全。3)模型可解释性不足:近几年的兵棋智能体研究大多基于深度强化学习算法,这类方法对智能体的环境,动作,反馈等做极大简化,且模型无法对策略结果进行解释,从而难以产生高价值和可解释的决策知识。技术实现思路1、有鉴于此,本发明的目的在于提供一种基于异构图神经网络的可解释兵棋预测方法及系统,该方法和系统从兵棋复盘数据出发,结合先验知识和推演规则,把环境、算子之间的多元复杂关系建模为多关系异构图,将态势的动态变化建模为异构图的动态更新,从而实现推演态势的动态建模与表征;在所构建的多关系异构图基础上,进一步利用时间序列表征方法捕捉整体局势,对赛事决胜进行预测,同时引入注意力机制来抽取兵棋推演中影响战局胜负的关键决策行为,并为模型可解释性提供支撑。2、为达到上述目的,本发明提供如下技术方案:3、一种基于异构图神经网络的可解释兵棋预测方法,在该方法中,包括以下步骤:s1、进行基于兵棋复盘数据的复杂态势特征抽取;s2、以多关系异构图为载体,基于动态推演数据,建立算子、地图、关键位置对象之间的复杂关系,并将指挥决策相关先验知识、推演规则、态势信息有机融合到异构图中,进行基于同构/异构图表示的态势建模;s3、进行基于多关系图的推演态势表征学习;s4、通过时间序列表征学习推演进程依赖;s5、进行胜负预测与可解释决策知识抽取。4、进一步,在步骤s1中,基于实时兵棋对抗复盘数据进行分析,每一场战局从部署阶段到结束阶段限制在1800时间步内,1时间步长为战局推演的最小时间单位,1800步结束之后以净胜分最高的对局方胜利,每一时间步下新的态势数据实时更新;进行态势数据处理时,态势数据以地图状态数据和算子状态数据切分,兵棋复盘数据以非结构化数据json文件存储,包括:1)地图静态数据:地图静态数据段包含7个特征:六角格的id、坐标、高程、地形、道路情况、有无河流和是否可掩藏;将数据规范为每个六角格节点自带的静态属性,并且假定从战局开始到结束静态特征不再改变;2)算子节点动态数据:所提取的特征涵盖地形利用,路线规划,时机把握,兵力部署方面,支持进攻,防守,侦察任务;由此考虑提取的算子节点特征包括算子类型,血量,装甲属性,机动能力,当前状态,原始提取特征数为53列,通过特征工程将部分离散特征,以及对连续型特征进行分箱,归一化后的特征列数为72。5、进一步,在步骤s2中,根据六角格节点特征和算子节点特征,利用同构和异构图来构建节点的多关系连接;具体包括:针对六角格节点,六角格之间通过无向边连接,表示其通视、邻居关系,若两个六角格之间相互可以通视,则有边进行连接,若无,则无边连接;对于六角格之间的关系,使用网络表示学习方法得到六角格的静态嵌入向量,作为后续任务的输入;针对算子节点,若算子之间存在观察和被观察关系,即侦察关系,则创建一条有向边,由侦察算子指向被侦察算子;若算子之间存在打击行为,则也相应创建一条边,由实施打击的算子指向被打击算子;针对六角格和算子节点,若算子处在某个六角格上,则在算子和六角格之间连接一条边,表示算子与六角格的隶属关系。6、进一步,在步骤s3中,所述进行基于多关系图的推演态势表征学习具体包括:7、1)六角格观察关系表征学习:对于构成的多关系图,首先采用图卷积神经网络表示学习方法(gcn)对六角格之间的观察(通视)关系进行学习;在六角格关系图学习的图卷积网络模型中,输入层接收具有特征向量的六角格节点集合,模型通过两个卷积层对节点特征进行处理;整个过程中,图卷积层的作用是利用图的结构信息和节点特征来学习节点的新特征表示,从而捕获图数据的拓扑结构和特征信息;8、2)算子节点关系表征学习:针对算子节点侦察与打击这两种影响战局胜负的关键行为,本方法将侦察关系与打击关系建模成图表示,使用图神经网络方法对每场战局每一时间步的两种关系进行学习,首先是算子与算子的侦察关系,随着战局推进,对局双方从部署阶段到交战阶段,最后到交战结束,侦察关系体现出稀疏,密集,稀疏的动态演变,为了捕捉该关系,本方法采用graphsage模型来学习图表示;9、3)算子与六角格隶属关系表示学习:考虑不同类型的算子节点与六角格节点之间的隶属关系,若算子位于某六角格中,则有无向边将其连接,在某一时刻下,该隶属关系图属于非连通异构图;与学习打击关系类似,本方法使用图自编码器(graphautoencoder)的方法来学习该隶属关系,在数据预处理模块,除了提取算子节点的特征,同时还提取六角格节点的特征;10、4)图表示融合模块:利用图表示融合模块(fusion model)综合地图六角格之间的通视关系,算子与算子之间的打击和侦察关系,以及算子与六角格之间的隶属关系,形成统一的表示,从全局把握影响战局胜负的关键行为因素,为后续分析兵棋动态演化模式提供输入。11、进一步,在步骤s4中,为了捕捉时间步之间短期和长期的相互依赖和相互作用,使用时间序列表征学习方法来对战局的所有时间步表征进行学习,具体包括:使用transformer模型学习每一场战局0-1800步的态势表征,得到战局整体态势信息;transformer的输入是0-1800时刻的态势表征,经过线性嵌入和位置编码后,利用自注意力和标准化模块进行特征学习,再通过前馈网络的传播和层归一化后得到输出结果,该结果作为预测器的输入。12、进一步,在步骤s5中,使用包括cnn卷积神经网络和全连接网络在内的深度学习分类网络,对胜(0)负(1)进行分类预测,在得到较好预测准确性的基础上,对结果反向研究,进一步得出影响兵棋决胜的重要决策因素。13、本发明还提供了一种基于异构图神经网络的可解释兵棋预测系统。14、本发明的有益效果在于:15、1)针对动态复杂推演环境下的时变态势表征难题,本发明提出基于多关系异构图的动态推演态势表征技术,通过结合先验知识和推演规则,把环境、算子的复杂关系建模为多关系异构图,将态势的动态变化建模为异构图的动态更新。同时在构建多关系异构图的过程中遵循可计算和准确性原则,使得构建的多关系异构图既能够被图神经网络等深度学习模型有效计算和处理,又能充分全面地反映推演过程中的环境、态势等信息。通过这一思路,将图神经网络领域最新的研究成果与兵棋推演知识挖掘有机结合,具有鲜明的技术特点。16、2)将注意力机制引入包含多种类型实体和关系的异构图中,区分不同粒度的信息重要性,同时学习不同对象之间的交互关系(如打击,侦察关系等)重要性,同时利用注意力机制学习态势推演中不同时刻的重要性变化,捕获影响决胜的重要态势,能为模型提供更高层次的可解释性。17、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

一种基于异构图神经网络的可解释兵棋预测方法