一种应用于语言模型的提示模板的处理方法及装置

专利检索2025-03-05  27


本发明涉及人工智能,具体为一种应用于语言模型的提示模板的处理方法及装置。


背景技术:

1、人工智能进入大模型的时代,大模型的功能不仅仅是对话和聊天。利用大模型的理解能力,可以支持不同使用场景的需求。若大模型对用户输入的指令的理解有误,则会发出错误的响应,影响用户的使用体验。

2、目前用于分析事件因果关系的技术大概分为两种方向,一是通过语言模型进行文本因果特征进行提取,用于事件因果关系分类,二是通过外部知识库进行数据增强,增加训练数据的多样性,从而提高训练模型的在事件因果关系分析中的判别能力。

3、在智能问答等人机对话场景中,可以基于预训练的大语言模型(large languagemode l s,llm)来处理用户输入的信息,以便于基于大语言模型较为强大的语义理解能力来理解用户的问题,并生成用户需要的答复内容,以满足用户较为复杂和多样化的需求。

4、由于语言模型表达的多样性的特征,导致通过知识库进行简单数据增强时,只是增加了具备相同文本特征的语料多样性,相当于让模型在一定数量具备相同语言文法特征下进行不断学习,并没有提高模型对自然语言文本中的知识进行处理,从而导致提示模板上展示的内容与提出的问题产生偏差,进而开发了一种应用于语言模型的提示模板的处理方法及装置,以便于解决上述中提出的问题。

5、本背景技术所公开的上述信息仅仅用于增加对本发明背景技术的理解,因此,其可能包括不构成本领域普通技术人员已知的现有技术。


技术实现思路

1、本发明的目的在于提供一种应用于语言模型的提示模板的处理方法及装置,以解决上述背景技术提出的目前市场上的问题。

2、为实现上述目的,本发明提供如下技术方案:一种应用于语言模型的提示模板的处理方法,包括以下步骤:

3、s1、首先,收集大规模的语言数据集,其中包括文本、对话和其他语言信息;

4、s2、根据提示的目的设计合适的模板结构,包括固定文本和可变参数部分;

5、s3、将设计好的提示模板转换为适合输入到语言模型的格式;

6、s4、将转换后的输入样本提供给语言模型进行训练或推理,以生成符合提示模板要求的文本输出。

7、作为本发明的进一步优化方案,所述在数据收集时,同步收集用户提供的文本反馈、评论和建议,并将其汇总后通过数据增强技术来扩充数据集。

8、作为本发明的进一步优化方案,所述设置多组不同类型的模板,同时根据实时状况,调整适当的模板,用于识别用户输入的意图或信息类型。

9、作为本发明的进一步优化方案,所述根据实际需求和场景,选择适合的语言模型架构和规模,同时收集的文本数据集,对选定的语言模型进行训练。

10、作为本发明的进一步优化方案,所述训练完成后,通过已经训练好的语言模型来生成文本,并且对生成的文本评估检验。

11、作为本发明的进一步优化方案,所述对生成的文本进行解析,提取其中的关键信息或结构化数据,同时对生成的文本内容对其进行分类或标记。

12、作为本发明的进一步优化方案,所述将生成的文本结果在界面上显示,并展示给使用人员。

13、一种应用于语言模型的提示模板的处理装置,包括:

14、至少一个处理器;

15、以及,与所述至少一个处理器通信连接的存储器;

16、其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任意一项所述的应用于语言模型的提示模板的处理方法。

17、与现有技术相比,本发明的有益效果是:

18、本发明通过对生成的文本结果进行质量评估和反馈,通过人工或自动评估来检验其准确性、流畅性和合理性,并提供反馈信息以优化模型的输出质量;

19、对用户输入进行关键词提取,然后与预定义的关键词进行匹配,以确定最相关的模板;并且设计模板匹配规则,表达式或类似的模式匹配算法,来对使用人员输入进行匹配,以确定最匹配的模板;

20、在数据收集过程中,对数据的质量和多样性进行检测,进而确保训练出的语言模型具有良好的泛化能力和表现。

21、上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。



技术特征:

1.一种应用于语言模型的提示模板的处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述在数据收集时,同步收集用户提供的文本反馈、评论和建议,并将其汇总后通过数据增强技术来扩充数据集。

3.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述设置多组不同类型的模板,同时根据实时状况,调整适当的模板,用于识别用户输入的意图或信息类型。

4.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述根据实际需求和场景,选择适合的语言模型架构和规模,同时收集的文本数据集,对选定的语言模型进行训练。

5.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述训练完成后,通过已经训练好的语言模型来生成文本,并且对生成的文本评估检验。

6.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述对生成的文本进行解析,提取其中的关键信息或结构化数据,同时对生成的文本内容对其进行分类或标记。

7.根据权利要求1所述的一种应用于语言模型的提示模板的处理方法,其特征在于,所述将生成的文本结果在界面上显示,并展示给使用人员。

8.一种应用于语言模型的提示模板的处理装置,其特征在于,包括:


技术总结
本发明公开了一种应用于语言模型的提示模板的处理方法及装置,属于人工智能技术领域,本发明包括以下步骤:S1、首先,收集大规模的语言数据集,其中包括文本、对话和其他语言信息;S2、根据提示的目的设计合适的模板结构,包括固定文本和可变参数部分;S3、将设计好的提示模板转换为适合输入到语言模型的格式。本发明通过对生成的文本结果进行质量评估和反馈,通过人工或自动评估来检验其准确性、流畅性和合理性,并提供反馈信息以优化模型的输出质量;对用户输入进行关键词提取,然后与预定义的关键词进行匹配,以确定最相关的模板;并且设计模板匹配规则,表达式或类似的模式匹配算法,来对使用人员输入进行匹配,以确定最匹配的模板。

技术研发人员:唐雨梦
受保护的技术使用者:华南师范大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1150732.html

最新回复(0)