一种交互方法、装置、电子设备及存储介质与流_中国专利数据库
全国客户服务热线:4006-054-001 疑难解答:159-9855-7370(7X24受理投诉、建议、合作、售前咨询),173-0411-9111(售前),155-4267-2990(售前),座机/传真:0411-83767788(售后),微信咨询:543646
企业服务导航

一种交互方法、装置、电子设备及存储介质与流

发布日期:2024-08-21 浏览次数: 专利申请、商标注册、软件著作权、资质办理快速响应热线:4006-054-001 微信:15998557370


一种交互方法、装置、电子设备及存储介质与流
申请号: 申请日:
公开(公告)号: 公开(公告)日:
发明(设计)人: 申请(专利权)人:
主分类号: 分类号:
代理公司: 代理人:
地址: 国省代码:
权利要求书: 说明书:
微信咨询: 添加微信:543646或【点此在线咨询 文件下载: 【点此下载】请正确填写本页网址和接收邮箱
摘要: 本发明涉及人工智能,特别是涉及一种交互方法、装置、电子设备及存储介质。、随着大语言模型(large language model,llm)技术的发展,以llm驱动的个人助理型智能体agent(也称为对话机器人,chatbot)迅速发展。这些智能体采用自然语言交互的方式,在获取用户的问题后根...
相关服务: 软件产品登记测试全国受理 软件著作权666元代写全部资料全国受理 实用新型专利1875代写全部资料全国受理

本发明涉及人工智能,特别是涉及一种交互方法、装置、电子设备及存储介质。背景技术:1、随着大语言模型(large language model,llm)技术的发展,以llm驱动的个人助理型智能体agent(也称为对话机器人,chatbot)迅速发展。这些智能体采用自然语言交互的方式,在获取用户的问题后根据用户的问题直接生成回答,并以统一的展现形式展现给用户。而单一的展现形式使得用户无法高效的从智能体的回答中获取需要的信息。技术实现思路1、鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种交互方法、装置、电子设备及存储介质。2、第一方面,本发明实施例公开了一种交互方法,包括:3、获取用户输入的对话信息;4、将所述对话信息输入目标意图识别模型,以确定所述对话信息的意图;5、将所述对话信息输入第一大语言模型,以生成所述对话信息的回复信息;6、将预设指令、所述对话信息、所述对话信息的意图和所述回复信息输入第二大语言模型,以确定所述回复信息中的目标文本;所述预设指令用于指示所述第二大语言模型根据所述对话信息和所述对话信息的意图从所述回复信息中确定目标文本;7、展示所述回复信息;其中,所述回复信息中目标文本的展示方式,区别于所述回复信息中除所述目标文本之外的其他文本的展示方式。8、可选地,所述第二大语言模型通过如下方式进行训练:9、获取多组第一训练样本数据;各组第一训练样本数据包括预设指令、样本对话信息、样本对话信息的意图、样本回复信息和标注突显词;所述样本对话信息的意图为所述目标意图识别模型根据所述样本对话信息识别得到,所述样本回复信息为所述第一大语言模型根据所述样本对话信息生成,所述标注突显词为用户从所述样本对话信息中选取的词;10、将所述多组第一训练样本数据输入预训练大语言模型以使所述预训练大语言模型进行学习;11、通过如下公式确定所述预训练大语言模型的损失值:12、13、其中,loss为所述预训练大语言模型的损失值,n为标注突显词的数量,k为所述预训练大语言模型的词表数量,yic为第i个标注突显词与所述词表的真实匹配结果,pic为第i个标注突显词与所述词表的预测匹配结果;14、根据所述预训练大语言模型的损失值对所述预训练大语言模型进行调整,以生成第二大语言模型。15、可选地,所述确定所述回复信息中的目标文本,包括:16、确定所述回复信息中的突显词,并对所述突显词设置第一标签;17、判断相邻突显词之间的文本数量是否小于或等于预设阈值;18、若相邻突显词之间的文本数量小于或等于预设阈值,则对所述相邻突显词之间的文本设置第一标签;19、对所述回复信息中未设置第一标签的文本设置第二标签;20、所述展示所述回复信息,包括:21、将设置有第一标签的突显词和文本按照第一预设展示方式进行展示,以及将设置有第二标签的文本按照第二预设展示方式进行展示。22、可选地,所述意图为解决专业问题,检索信息,写作任务,寻求创意,获取建议,休闲娱乐和其他中的一种。23、可选地,所述目标意图识别模型通过如下方式进行训练:24、获取多组第二训练样本数据;各组第二训练样本数据包括样本对话信息和标注意图;所述标注意图为用户根据所述样本对话信息从意图选项中选择确定的;25、将所述多组第二训练样本数据输入预训练意图识别模型,以使所述预训练意图识别模型进行学习;26、通过如下公式确定所述预训练意图识别的损失值:27、28、其中,loss’表示所述预训练意图识别模型的损失值,n’为第二训练样本数据的数量,k’为意图选项的个数,yic’为第i’个第二训练样本数据对应的标注意图与意图选项的真实匹配结果,pic’为第i’个第二训练样本数据对应的标注意图与意图选项的预测匹配结果;29、根据所述预训练意图识别的损失值对所述预训练意图识别模型进行调整,以生成目标意图识别模型。30、可选地,所述交互方法还包括:31、将所述对话信息、所述回复信息和所述回复信息中的突显词输入目标评价模型,以生成对所述回复信息和回复信息的展示方式的评价结果。32、可选地,所述目标评价模型通过如下方式进行训练:33、获取多组第三训练样本数据;各组第三训练样本数据包括样本对话信息、通过所述第一大语言模型根据所述样本对话信息生成的样本回复信息、样本回复信息的标签信息,和,用户针对于所述样本回复信息、所述样本回复信息的展示方式输入的第一评价结果;其中所述标签信息包括所述样本回复信息中的第一标签和第二标签;34、将所述第三训练样本数据输入预训练评价模型,以生成第二评价结果;35、根据所述第一评价结果和所述第二评价结果对所述预训练评价模型进行调整,以生成目标评价模型。36、第二方面,本发明实施例公开了一种交互装置,包括:37、对话信息获取模块,用于获取用户输入的对话信息;38、意图识别模块,用于将所述对话信息输入目标意图识别模型,以确定所述对话信息的意图;39、回复信息生成模块,用于将所述对话信息输入第一大语言模型,以生成所述对话信息的回复信息;40、目标文本生成模块,用于将预设指令、所述对话信息、所述对话信息的意图和所述回复信息输入第二大语言模型,以确定所述回复信息中的目标文本;所述预设指令用于指示所述第二大语言模型根据所述对话信息和所述对话信息的意图从所述回复信息中确定目标文本;41、展示模块,用于展示所述回复信息;其中,所述回复信息中目标文本的展示方式,区别于所述回复信息中除所述目标文本之外的其他文本的展示方式。42、可选地,所述交互装置包括:第二大语言模型训练模型,用于获取多组第一训练样本数据;各组第一训练样本数据包括预设指令、样本对话信息、样本对话信息的意图、样本回复信息和标注突显词;所述样本对话信息的意图为所述目标意图识别模型根据所述样本对话信息识别得到,所述样本回复信息为所述第一大语言模型根据所述样本对话信息生成,所述标注突显词为用户从所述样本回复信息中选取的词;将所述多组第一训练样本数据输入预训练大语言模型以使所述预训练大语言模型进行学习;通过如下公式确定所述预训练大语言模型的损失值:43、44、其中,loss为所述预训练大语言模型的损失值,n为标注突显词的数量,k为所述预训练大语言模型的词表数量,yic为第i个标注突显词与所述词表的真实匹配结果,pic为第i个标注突显词与所述词表的预测匹配结果;45、根据所述预训练大语言模型的损失值对所述预训练大语言模型进行调整,以生成第二大语言模型。46、可选地,所述目标文本生成模块具体用于:确定所述回复信息中的突显词,并对所述突显词设置第一标签;判断相邻突显词之间的文本数量是否小于或等于预设阈值;若相邻突显词之间的文本数量小于或等于预设阈值,则对所述相邻突显词之间的文本设置第一标签;对所述回复信息中未设置第一标签的文本设置第二标签;47、所述展示模块具体用于:将设置有第一标签的突显词和文本按照第一预设展示方式进行展示,以及将设置有第二标签的文本按照第二预设展示方式进行展示。48、可选地,所述意图为解决专业问题,检索信息,写作任务,寻求创意,获取建议,休闲娱乐和其他中的一种。49、可选地,所述交互装置包括目标意图识别模型训练模块,用于获取多组第二训练样本数据;各组第二训练样本数据包括样本对话信息和标注意图;所述标注意图为用户根据所述样本对话信息从意图选项中选择确定的;将所述多组第二训练样本数据输入预训练意图识别模型,以使所述预训练意图识别模型进行学习;通过如下公式确定所述预训练意图识别的损失值:50、51、其中,loss’表示所述预训练意图识别模型的损失值,n’为第二训练样本数据的数量,k’为意图选项的个数,yic’为第i’个第二训练样本数据对应的标注意图与意图选项的真实匹配结果,pic’为第i’个第二训练样本数据对应的标注意图与意图选项的预测匹配结果;52、根据所述预训练意图识别的损失值对所述预训练意图识别模型进行调整,以生成目标意图识别模型。53、可选地,所述交互装置还包括:54、评价模块,用于将所述对话信息、所述回复信息和所述回复信息中的突显词输入目标评价模型,以生成对所述回复信息和回复信息的展示方式的评价结果。55、可选地,所述交互装置还包括:56、目标评价模型训练模块,用于获取多组第三训练样本数据;各组第三训练样本数据包括样本对话信息、通过所述第一大语言模型根据所述样本对话信息生成的样本回复信息、样本回复信息的标签信息,和,用户针对于所述样本回复信息、所述样本回复信息的展示方式输入的第一评价结果;其中所述标签信息包括所述样本回复信息中的第一标签和第二标签;将所述第三训练样本数据输入预训练评价模型,以生成第二评价结果;根据所述第一评价结果和所述第二评价结果对所述预训练评价模型进行调整,以生成目标评价模型。57、第三方面,本发明还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的交互方法的步骤。58、第四方面,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述的交互方法的步骤。59、本发明实施例包括以下优点:60、本发明实施例通过在用户与大语言模型的对话场景中,在第一大语言模型根据用户的对话信息生成回复信息后,还通过目标意图识别模型识别用户的对话意图,通过第二大语言模型基于用户的对话意图从回复信息中识别出目标文本,目标文本为用户关注度更高的文本,则将回复信息展示给用户时,将目标文本进行区别展示,例如,加粗、加下划线、设置为红色字体等,使得用户可以快速关注到回复信息中的目标文本,高效获取到需求的信息。61、以及,本发明实施例通过第二大语言模型从回复信息中识别目标文本,相比于传统的目标文本识别模型通用性更高。并且,通过将预设指令与用户输入的对话信息、对话信息的意图、回复信息进行拼接后输入第二大语言模型,使得第二大语言模型可以根据预设指令,更准确的从回复信息中确定目标文本。

一种交互方法、装置、电子设备及存储介质与流