一种回复生成方法、装置、电子设备和存储介质与流程

专利检索2025-05-01  23


本申请涉及数据处理,特别是涉及一种回复生成方法、装置、电子设备和存储介质。


背景技术:

1、大语言模型,能够理解和生成自然语言,适用于广泛的话题和复杂的交互场景,在开放域交互和文本生成等方面展现出强大的灵活性和适应性;但是,大语言模型在特定任务(如,查询天气、播放音乐、车辆控制等)的处理准确性方面不如目标模型(模型参数小于大语言模型的模型),特别是在需要高精确度和实时响应的应用场景中。目标模型,在特定任务(如查询天气、播放音乐、车辆控制等)上显示出高准确度;但是,目标模型在处理更广泛的话题和复杂的交互场景、在开放域交互的任务时,灵活性较差、准确度不高。

2、目前,智能交互系统要么主要依赖于大语言模型,要么依赖于目标模型。然后,这两类模型各自存在的局限性导致它们在对方的优势领域表现不足。


技术实现思路

1、本申请主要解决的技术问题是提供一种回复生成方法、装置、电子设备和存储介质,能够提高生成回复的准确性和效率,且生成的回复更加流畅、贴近人类自然交流方式。

2、为解决上述技术问题,本申请采用的一个技术方案是:提供一种回复生成方法,该方法包括:获取用户输入内容;利用大语言模型基于用户输入内容进行意图识别,得到至少一个交互意图;利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

3、为解决上述技术问题,本申请采用的另一技术方案是:提供一种回复生成方法,该方法包括:获取用户输入内容;利用大语言模型对用户输入内容进行意图识别,得到至少一个交互意图;将至少一个交互意图发送至交互后端,以使交互后端利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

4、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种回复生成方法,该方法包括:接收交互前端发送的至少一个交互意图,至少一个交互意图是交互前端利用大语言模型对用户输入内容进行意图识别得到;利用目标模型分别基于各交互意图进行答复生成,得到各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

5、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种交互装置,该装置包括获取模块、识别模块和生成模块;获取模块用于获取用户输入内容;识别模块用于利用大语言模型基于用户输入内容进行意图识别,得到至少一个交互意图;生成模块用于利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

6、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种交互装置,该装置包括获取模块、识别模块和发送模块;获取模块用于获取用户输入内容;识别模块用于利用大语言模型对用户输入内容进行意图识别,得到至少一个交互意图;发送模块用于将至少一个交互意图发送至交互后端,以使交互后端利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

7、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种回复生成装置,该装置包括接收模块和生成模块;接收模块用于接收交互前端发送的至少一个交互意图,至少一个交互意图是交互前端利用大语言模型对用户输入内容进行意图识别得到;生成模块用于利用目标模型分别基于各交互意图进行答复生成,得到各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。

8、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上的方法。

9、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于执行程序指令,程序指令能够被执行以实现上述的方法。

10、上述技术方案,标模型基于各交互意图生成各交互意图对应的初始回复,而各交互意图是利用大语言模型基于用户输入内容进行意图识别的;所以,生成针对用户输入内容的回复是结合大语言模型和目标模型的,大语言模型和目标模型的结合,会利用各自优势互补生成回复;所以,一方面,生成的回复的准确性、效率更高;另一方面,生成的回复更加流畅、贴近人类自然交流方式,提高了交互过程中的灵活性和自然性。



技术特征:

1.一种回复生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述用户输入内容进行意图识别,得到至少一个交互意图,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述历史交互信息,对所述用户输入内容进行意图识别,得到至少一个所述交互意图,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述历史交互信息,对所述用户输入内容进行改写,得到经改写的用户输入内容,包括:

5.根据权利要求1所述的方法,其特征在于,在所述利用目标模型分别基于各所述交互意图,生成各所述交互意图对应的初始回复之后,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述初始回复包括初始回复文本和所述初始回复文本的可靠程度;在所述基于所述初始回复,生成目标回之前,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述利用与所述初始回复文本的可靠程度匹配的回复生成方法,对所述初始回复进行重新生成,得到所述目标回复,包括:

8.根据权利要求1所述的方法,其特征在于,所述目标模型为小模型,和/或,所述大语言模型为生成式大模型。

9.一种回复生成方法,其特征在于,所述方法包括:

10.一种回复生成方法,其特征在于,所述方法包括:

11.一种回复生成装置,其特征在于,所述方装置包括:

12.一种回复生成装置,其特征在于,所述装置包括:

13.一种回复生成装置,其特征在于,所述装置包括:

14.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-10任一项所述的方法。

15.一种计算机可读存储介质,所述计算机可读存储介质用于执行程序指令,所述程序指令能够被执行以实现如权利要求1-10任一项所述的方法。


技术总结
本申请公开了一种回复生成方法、装置、电子设备和存储介质,该方法包括:获取用户输入内容;利用大语言模型基于用户输入内容进行意图识别,得到至少一个交互意图;利用目标模型分别基于各交互意图,生成各交互意图对应的初始回复,目标模型的模型参数少于大语言模型。通过上述方式,本申请能够提高生成回复的准确性和效率,且生成的回复更加流畅、贴近人类自然交流方式。

技术研发人员:蒋兵兵,张行开,龙明康,凤斌,潘冬阳
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1153245.html

最新回复(0)