家居专利数据库

一种通信协议格式逆向处理方法及装置

发布日期:2024-08-21 浏览次数:

本发明涉及人工智能,具体涉及一种通信协议格式逆向处理方法及装置。另外,还涉及一种电子设备及处理器可读存储介质。背景技术:1、通信协议是通信、工业、电力系统等行业的重要组成部分,它起着为系统内各个部件建立通讯连接的重要作用,除了用于交换数据、交换信息等基本功能,部分协议更是具备控制远端设备的权限。协议逆向是指对通信协议的语法-语义理解和分析的过程。协议逆向对于网络安全研究、恶意软件分析、网络流量分析、网络协议的互操作性测试等领域都非常重要。通过理解和分析协议,可以更好地应对网络攻击、解决通信问题以及改进网络通信的性能和安全性。然而,目前传统的基于流量的协议逆向工具依赖于报文类型的完备性,遭受有限信息的侵扰使其准确性不足,未出现在受试数据中的报文类型其语法格式并无法获取,使其无法支持下游任务。因此,如何设计一种更为有效的通信协议格式逆向处理方案成为当前亟待解决的问题。技术实现思路1、为此,本发明提供一种通信协议格式逆向处理方法及装置,以解决现有技术中存在的通信协议格式逆向处理方案局限性较高,从而导致通信协议格式推断效率和精确度较差的缺陷。2、第一方面,本发明提供一种通信协议格式逆向处理方法,包括:3、获取与通信协议对应的消息数据包;4、基于预设的语法逆向模型对所述消息数据包进行处理,获得所述语法逆向模型输出的语法标记序列;其中,所述语法逆向模型是预先基于样本消息数据包以及所述样本消息数据包对应语法结构的样本语法标记序列进行知识迁移训练得到的;5、基于预设的优化器对所述消息数据包进行处理,获得相应的字段间变化特征表示信息,并对所述字段间变化特征表示信息和语法标记序列进行融合处理,获得所述通信协议的协议格式信息。6、进一步的,所述基于预设的语法逆向模型对所述消息数据包进行处理,获得所述语法逆向模型输出的语法标记序列,具体包括:7、将所述消息数据包转换为通信协议报文的观测序列;8、将所述通信协议报文的观测序列输入到所述语法逆向模型进行处理,获得所述语法逆向模型输出的语法标记序列。9、进一步的,所述基于预设的优化器对所述消息数据包进行处理,获得相应的字段间变化特征表示信息,具体包括:10、将所述消息数据包转换为通信协议中协议报文的二进制序列;11、基于所述二进制序列,获得二进制值组成的二进制向量;12、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行信息结构变化捕捉,获得字段间变化特征表示信息。13、进一步的,所述对所述字段间变化特征表示信息和语法标记序列进行融合处理,获得所述通信协议的协议格式信息,具体包括:14、将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器进行融合处理,获得所述通信协议的协议格式信息。15、进一步的,所述将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器进行融合处理,获得所述通信协议的协议格式信息,具体包括:16、将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器,通过预设的加权投票策略对不同维度的字段间变化特征表示信息与所述字段间变化特征进行融合处理,获得所述通信协议的协议格式信息;其中,所述不同维度的字段间变化特征表示信息包括通信协议消息连续字节在比特位上的结构变化特征。17、进一步的,所述基于所述二进制向量输入到所述优化器中的比特流特征提取器进行信息结构变化捕捉,获得字段间变化特征表示信息,包括:18、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第一维度下的信息结构变化捕捉,获得第一特征表示;19、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第二维度下的信息结构变化捕捉,获得第二特征表示;20、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第三维度下的信息结构变化捕捉,获得第三特征表示;21、将所述第一特征表示、所述第二特征表示以及所述第三特征表示作为所述字段间变化特征表示信息。22、第二方面,本发明还提供一种通信协议格式逆向处理装置,包括:23、消息数据获取单元,用于获取与通信协议对应的消息数据包;24、逆向处理单元,用于基于预设的语法逆向模型对所述消息数据包进行处理,获得所述语法逆向模型输出的语法标记序列;其中,所述语法逆向模型是预先基于样本消息数据包以及所述样本消息数据包对应语法结构的样本语法标记序列进行知识迁移训练得到的;25、优化融合处理单元,用于处理基于预设的优化器对所述消息数据包进行处理,获得相应的字段间变化特征表示信息,并对所述字段间变化特征表示信息和语法标记序列进行融合处理,获得所述通信协议的协议格式信息。26、进一步的,所述逆向处理单元,具体用于:27、将所述消息数据包转换为通信协议报文的观测序列;28、将所述通信协议报文的观测序列输入到所述语法逆向模型进行处理,获得所述语法逆向模型输出的语法标记序列。29、进一步的,所述优化融合处理单元,具体用于:30、将所述消息数据包转换为通信协议中协议报文的二进制序列;31、基于所述二进制序列,获得二进制值组成的二进制向量;32、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行信息结构变化捕捉,获得字段间变化特征表示信息。33、进一步的,所述优化融合处理单元,具体用于:34、将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器进行融合处理,获得所述通信协议的协议格式信息。35、进一步的,所述将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器进行融合处理,获得所述通信协议的协议格式信息,具体包括:36、将所述字段间变化特征表示信息和语法标记序列输入到所述优化器中的融合器,通过预设的加权投票策略对不同维度的字段间变化特征表示信息与所述字段间变化特征进行融合处理,获得所述通信协议的协议格式信息;其中,所述不同维度的字段间变化特征表示信息包括通信协议消息连续字节在比特位上的结构变化特征。37、进一步的,所述基于所述二进制向量输入到所述优化器中的比特流特征提取器进行信息结构变化捕捉,获得字段间变化特征表示信息,包括:38、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第一维度下的信息结构变化捕捉,获得第一特征表示;39、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第二维度下的信息结构变化捕捉,获得第二特征表示;40、基于所述二进制向量输入到所述优化器中的比特流特征提取器进行第三维度下的信息结构变化捕捉,获得第三特征表示;41、将所述第一特征表示、所述第二特征表示以及所述第三特征表示作为所述字段间变化特征表示信息。42、第三方面,本发明还提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的通信协议格式逆向处理方法的步骤。43、第四方面,本发明还提供一种处理器可读存储介质,所述处理器可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一项所述的通信协议格式逆向处理方法的步骤。44、本发明提供的通信协议格式逆向处理方法,通过获取与通信协议对应的消息数据包;基于预设的语法逆向模型对所述消息数据包进行处理,获得所述语法逆向模型输出的语法标记序列,所述语法逆向模型是预先基于样本消息数据包以及所述样本消息数据包对应语法结构的样本语法标记序列进行知识迁移训练得到的,基于预设的优化器对所述消息数据包进行处理,获得相应的字段间变化特征表示信息,并对所述字段间变化特征表示信息和语法标记序列进行融合处理,获得所述通信协议的协议格式信息,其能够有效提高通信协议格式推断结果的效率和精确度。