虚拟对象互动方法及装置与流程

专利检索2025-02-16 54

本发明涉及人工智能，具体涉及一种虚拟对象互动方法及装置。

背景技术：

1、虚拟对象是指通过计算技术生成的虚拟人物或角色，主流形式是数字人，这些数字人具有逼真的外表、智能的行为以及交互能力，能够展现出多样化的外貌、表情和动作。

2、目前，大部分数字人均可以语音的方式和用户互动，数字人可根据用户输入的语音，产生相应的语音回复。然而，数字人在输出语音回复时，用户通常只能被动地聆听，无法对回复进行调节，导致了互动的局限性，难以实现灵活地互动。

技术实现思路

1、针对上述问题，本发明的目的在于提供一种虚拟对象互动方法及装置，可以提升与虚拟对象互动的灵活性。

2、为解决上述技术问题，本发明提供如下技术方案：

3、一方面，提供一种虚拟对象互动方法，包括：

4、对待解答文本进行拆解处理，得到问题序列，所述问题序列包括按照解答顺序排列的多个子问题；

5、为每个所述子问题分配处理线程，并基于所述处理线程将所述子问题发送至预设模型，以获取每个子问题对应的子答案；

6、若检测到所述问题序列中的首个子问题对应的子答案，将多个子答案按照所述解答顺序存储为答案序列并控制虚拟对象按照所述解答顺序输出多个子答案；

7、若在所述虚拟对象按照所述解答顺序输出多个子答案的过程中检测到调节指令，将所述虚拟对象正在输出的子答案确定为目标答案；

8、基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率；

9、控制所述虚拟对象以所述响应速率输出所述响应内容。

10、可选地，所述调节指令包括中断指令和续播指令，所述基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

11、响应于所述中断指令，控制所述虚拟对象暂停输出所述多个子答案；

12、将所述目标答案划分为已输出答案和未输出答案；

13、响应于所述续播指令，获取所述续播指令和所述中断指令之间的时间间隔；

14、若所述时间间隔大于预设间隔，基于所述未输出答案的语义完整性、所述已输出答案以及所述答案序列，确定响应内容；

15、若所述时间间隔不大于预设间隔，基于所述已输出答案和所述答案序列确定响应内容；

16、将所述虚拟对象按照所述解答顺序输出多个子答案时的速率，作为响应速率。

17、可选地，所述基于所述未输出答案的语义完整性、所述已输出答案以及所述答案序列，确定响应内容，包括：

18、检测所述未输出答案的语义完整性；

19、若所述未输出答案的语义完整，将所述未输出答案以及指定答案作为响应内容，所述指定答案为所述答案序列中位于所述目标答案之后的所有子答案；

20、若所述未输出答案的语义不完整，从所述已输出答案中确定待新增内容；

21、将所述待新增内容和所述未输出答案进行拼接处理，得到新的未输出答案；

22、返回执行检测所述未输出答案的语义完整性的步骤以及后续步骤，直到确定出响应内容。

23、可选地，所述从所述已输出答案中确定待新增内容，包括：

24、基于所述已输出答案和所述未输出答案，从所述目标答案中确定中断位置；

25、对所述目标答案进行分词处理，得到分词序列，所述分词序列包括多个待处理词；

26、若所述中断位置处于所述待处理词中，将所述待处理词中位于所述已输出答案中的文本，确定为待新增内容；

27、若所述中断位置不处于所述待处理词中，将所述分词序列中所述未输出答案的前一待处理词确定为待新增内容。

28、可选地，所述基于所述已输出答案和所述答案序列确定响应内容，包括：

29、将获取所述目标答案的处理线程确定为指定线程；

30、将所述已输出答案、所述目标答案对应的子问题以及预设提示词，通过所述指定线程发送至所述预设模型中，得到预测答案，其中，所述预测答案以所述已输出答案为开头；

31、从所述预测答案中去除所述已输出答案，得到待使用答案；

32、将所述待使用答案以及指定答案作为响应内容，所述指定答案为所述答案序列中位于所述目标答案之后的所有子答案。

33、可选地，所述调节指令包括跳转指令，所述基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

34、响应于所述跳转指令，获取所述跳转指令对应的跳转参数；

35、基于所述目标答案在所述答案序列中的位置以及所述跳转参数，确定跳转答案；

36、将所述跳转答案以及所述答案序列中位于所述跳转答案之后的所有子答案，确定为响应内容；

37、将所述虚拟对象依序输出多个子答案时的速率，作为响应速率。

38、可选地，所述调节指令包括变速指令，所述基于目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

39、响应于变速指令，将所述变速指令对应的速率作为响应速率；

40、从所述目标答案中确定未输出答案，将所述未输出答案以及指定答案，确定为响应内容，所述指定答案为所述答案序列中位于所述目标答案之后的所有子答案。

41、可选地，所述控制所述虚拟对象以所述响应速率输出所述响应内容，包括：

42、预估在所述响应速率下，所述响应内容中的每个子答案对应的输出时长；

43、利用基准时长以及每个子答案对应的输出时长，确定响应序列，所述响应序列包括响应子内容；

44、基于所述解答顺序从所述响应序列中确定目标子内容，并控制虚拟对象以所述响应速率输出所述目标子内容；

45、若在输出所述目标子内容的预设时长内未检测到调节指令，返回执行基于所述解答顺序从所述响应序列中确定目标子内容，并控制虚拟对象以所述响应速率输出所述目标子内容的步骤以及后续步骤，直到所有响应子内容被输出或者接收到新的调节指令。

46、可选地，所述对待解答文本进行拆解处理，得到问题序列，包括：

47、对所述待解答文本进行意图识别处理，得到待解答文本对应的待解答意图；

48、对所述待解答文本进行命名实体识别，得到待解答实体；

49、基于预设意图与问题模板之间的映射关系以及所述待解答意图，确定候选问题模板；

50、基于所述待解答实体以及所述候选问题模板，生成问题序列。

51、另一方面，还提供一种虚拟对象互动装置，用于实现上述任一项所述的方法，包括：

52、拆解模块，用于对待解答文本进行拆解处理，得到问题序列，所述问题序列包括按照解答顺序排列的多个子问题；

53、分配模块，用于为每个所述子问题分配处理线程，并基于所述处理线程将所述子问题发送至预设模型，以获取每个子问题对应的子答案；

54、输出存储模块，用于若检测到所述问题序列中的首个子问题对应的子答案，将多个子答案按照所述解答顺序存储为答案序列并控制虚拟对象按照所述解答顺序输出多个子答案；

55、指令检测模块，用于若在所述虚拟对象按照所述解答顺序输出多个子答案的过程中检测到调节指令，将所述虚拟对象正在输出的子答案确定为目标答案；

56、响应确定模块，用于基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率；

57、响应输出模块，用于控制所述虚拟对象以所述响应速率输出所述响应内容。

58、另一方面，还提供一种是电子设备，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行本发明所提供的任一种虚拟对象互动方法中的步骤。

59、另一方面，还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明所提供的任一种虚拟对象互动方法中的步骤。

60、另一方面，还提供一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现本发明所提供的任一种虚拟对象互动方法中的步骤。

61、本发明提供的技术方案带来的有益效果至少包括：

62、本发明实施例中，将待解答文本拆解为多个子问题，得到按照解答顺序排列的问题序列；为每个子问题分配一个处理线程，以并行获取各个子问题对应的子答案；在检测到首个子问题的子答案时，则控制虚拟对象按照解答顺序输出子答案的同时，将子答案存储为答案序列；若在虚拟对象输出子答案的过程中，检测到调节指令，则基于目标答案和答案序列，确定对应的响应内容和响应速率；再控制虚拟对象以响应速率输出响应内容。其中，分配处理线程并行处理每个子问题，可快速获取到所有子问题对应的子答案，为后续调节提供数据支撑，在虚拟对象输出的过程中，可使用调节指令调节内容或速率中的至少一种，从而提升了和虚拟对象互动的灵活性。

技术特征：

1.一种虚拟对象互动方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述调节指令包括中断指令和续播指令，所述基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述未输出答案的语义完整性、所述已输出答案以及所述答案序列，确定响应内容，包括：

4.根据权利要求3所述的方法，其特征在于，所述从所述已输出答案中确定待新增内容，包括：

5.根据权利要求2所述的方法，其特征在于，所述基于所述已输出答案和所述答案序列确定响应内容，包括：

6.根据权利要求1所述的方法，其特征在于，所述调节指令包括跳转指令，所述基于所述目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

7.根据权利要求1所述的方法，其特征在于，所述调节指令包括变速指令，所述基于目标答案以及所述答案序列，确定所述调节指令对应的响应内容和响应速率，包括：

8.根据权利要求7所述的方法，其特征在于，所述控制所述虚拟对象以所述响应速率输出所述响应内容，包括：

9.根据权利要求1所述的方法，其特征在于，所述对待解答文本进行拆解处理，得到问题序列，包括：

10.一种虚拟对象互动装置，用于实现如权利要求1-9中任一项所述的方法，其特征在于，所述装置包括：

技术总结
本发明提供一种虚拟对象互动方法及装置，涉及人工智能技术领域。所述方法包括：对待解答文本进行拆解处理，得到问题序列；为每个子问题分配处理线程，得以获取子答案；若检测到首个子问题对应的子答案，则控制虚拟对象按序输出并同步将子答案存储为答案序列；在虚拟对象输出的过程中检测到调节指令，则利用虚拟对象正在输出的子答案和答案序列，确定出响应内容和响应速率；再控制虚拟对象以响应速率输出响应内容。其中，分配处理线程并行处理每个子问题，可快速获取到所有子问题对应的子答案，为后续调节提供数据支撑，在虚拟对象输出的过程中，可对内容、速率等进行调节，从而提升了和虚拟对象互动的灵活性。

技术研发人员：王璟瑶,屠静,王亚
受保护的技术使用者：卓世科技（海南）有限公司
技术研发日：
技术公布日：2024/5/29

转载请注明原文地址:https://win.8miu.com/read-1150140.html

专利

最新回复(0)