本公开属于人工智能,更具体地说,是涉及一种大语言模型指导的智能体动作控制方法及装置。
背景技术:
1、智能体控制是一种利用人工智能技术实现自动控制的方法。它通常用于辅助技术、游戏ai、机器人控制等领域,以提高用户体验和任务效率。提升智能体对智能体的操作流畅性,使其能够高效地执行各类计算机任务,是实现智能体成为人类计算机助手的不可避免挑战。
2、目前智能体控制方法主要是利用机器学习、强化学习等技术,使智能体能够根据任务自动调整其行为,但现有的智能体控制的精准性差,导致智能体执行任务作时下一个状态分布与专家的状态分布不匹配,很难解决精准性的计算机控制问题。
技术实现思路
1、本公开的目的在于提供一种大语言模型指导的智能体动作控制方法及装置,以解决目前智能体控制的精准性差的问题。
2、本公开实施例的第一方面,提供了一种大语言模型指导的智能体动作控制方法,包括:
3、基于大语言模型将目标任务转换为智能体的目标动作序列;
4、将所述目标动作序列输入至第一智能体控制模型中以实现所述智能体的控制。
5、本公开实施例的第二方面,提供了一种大语言模型指导的智能体动作控制装置,包括:
6、动作序列生成模块:用于基于大语言模型将目标任务转换为智能体的目标动作序列;
7、智能体控制模块:用于将所述目标动作序列输入至第一智能体控制模型中以实现所述智能体的控制。
8、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种大语言模型指导的智能体动作控制方法的步骤。
9、本公开实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种大语言模型指导的智能体动作控制方法的步骤。
10、本公开实施例提供的一种大语言模型指导的智能体动作控制方法及装置的有益效果在于:本发明引入了大语言模型,大语言模型可以对目标任务进行拆解,转换成智能体的目标动作序列,这样可以将复杂的任务转换成简单的动作序列,化繁为简,将任务复杂度降低,从而能够提高对智能体的控制精准性;然后将目标动作序列输入到第一智能体控制模型中,第一智能体控制模型用于预测智能体光标的移动和点击动作,智能体的光标会根据预测结果执行相应的移动和点击动作,最终完成整个目标动作序列。
1.一种大语言模型指导的智能体动作控制方法和装置,其特征在于,包括:
2.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述基于大语言模型将目标任务转换为智能体的目标动作序列,包括:
3.如权利要求2所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述根据所述子任务序列的环境状态信息对所述子任务序列进行修正得到智能体的所述目标动作序列,包括:
4.如权利要求3所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述当每个子任务的当前环境状态信息与预测环境状态信息序列存在差异时,根据差异得到修正意见信息,包括:
5.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述将所述目标动作序列输入至第一智能体控制模型中以实现所述智能体的控制,包括:
6.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,还包括:
7.如权利要求6所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述将训练任务输入至第二智能体控制模型中,得到所述第一智能体控制模型,包括:
8.一种大语言模型指导的智能体动作控制装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
