一种基于提示工程和微调技术的文本生成方法及系统与流程

专利检索2025-02-28 38

本发明涉及自然语言处理，并且更具体地，涉及一种基于提示工程和微调技术的文本生成方法及系统。

背景技术：

1、自然语言处理技术在近几十年来得到高速发展，这一技术随即被应用在越来越多的领域中，文本生成就是重要方向之一。目前，常见的文本生成技术主要是基于传统神经网络的文本生成方法、基于生成对抗网络的文本生成技术、引入强化学习的文本生成方法，循环神经网络长期以来都被视为处理序列问题的有效工具，并且也已经有大量研究人员把这一模型应用在构造语言模型上。例如，发明申请cn114462419a公开了一种文本生成模型及文本生成方法。其中，文本生成模型，包括：编码模块和解码模块。编码模块适于对输入数据进行处理，以提取出指示其语义特征的第一向量；解码模块适于对第一向量进行处理，以生成至少一个句向量，来组成长文本。进一步地，解码模块又包括：子句内容规划单元，与编码模块耦接，适于接收编码模块的输出，对编码模块输出的第一向量进行处理，以确定出至少一个指示子句语义特征的第二向量；单词生成单元，与子句内容规划单元耦接，适于对第二向量进行处理，生成多个单词对应的词向量，以及，利用词向量，组合成至少一个句向量，来生成长文本。

2、“大算力+强算法”的出现改变了传统人工智能时代是“一场景一模型”的“小作坊模式”，它收集大量图像、文本等数据，利用无监督或者自监督学习方法训练出通用基础模型，遇到特定任务时，只需要输入特定的数据即可生成符合实际场景的应用。人工智能大语言模型从支持图片、图像、文本、语音单一模态下的单一任务，逐渐发展为支持多种模态下的多种任务，参数量实现了从亿级到百万亿级的突破。但是，现有的大语言模型在专业问答领域中应用时未考虑实际使用过程中gpu资源有限问题，导致使用过程中设备资源利用率较低，因此现有的大语言模型在专业问答领域中存在任务执行较差、专业知识欠缺的情况。

技术实现思路

1、针对现有技术的不足，本发明提供一种基于提示工程和微调技术的文本生成方法及系统。

2、根据本发明的一个方面，提供了一种基于提示工程和微调技术的文本生成方法，包括：

3、根据目标场景的需求，采用微调技术对开源的embedding模型进行优化和微调；

4、将目标场景涉及的知识文本通过微调后的embedding模型转化为向量，之后存储在预设的向量数据库中；其中，知识文本包括问题和答案；

5、将用户问题通过微调后的embedding模型转化为问题向量，并在向量数据库中检索与问题向量相似度最高的向量，作为匹配向量；

6、将匹配向量转化为匹配文本，基于匹配文本、用户问题和知识文本，利用提示工程技术，生成符合目标场景需求的提示词；

7、将提示词、匹配文本和用户问题一同送入预设的大语言模型，生成与用户问题匹配的答案；

8、其中，所述根据目标场景的需求，采用微调技术对开源的embedding模型进行优化和微调，具体包括：

9、根据目标场景的需求，确定目标场景下的查询数据以及与查询数据对应的正负样本；

10、基于查询数据和对应的正负样本，构建微调数据集；

11、将低秩适配法应用于开源的embedding模型的交叉注意力机制全连接层的权重矩阵上，基于构建的微调数据集，对开源的embedding模型进行优化和微调。

12、可选地，所述将目标场景涉及的知识文本通过微调后的embedding模型转化为向量，具体包括：

13、收集目标场景涉及的知识文本，并对知识文本进行断句处理，得到多个句子；

14、将每个句子进一步切分成单独的词语，在去除停用词后，对每个词语进行词性标注，确定每个词语的语义角色；

15、根据每个词语的语义角色，对断句得到的每个句子进行句法分析，确定每个句子中各个词语之间的语法关系；

16、通过语法关系和语义上下文信息，对断句得到的每个句子进行语义理解，确定每个句子的语义信息；

17、根据目标场景的任务需求以及每个句子的语义信息，对知识文本进行标注，确定知识文本的类别标签；

18、将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量。

19、可选地，所述将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量，具体包括：

20、将带有类别标签的知识文本按照预设长度进行分段处理；

21、将分段处理得到的各段知识文本分别送入微调后的embedding模型，得到多段文本向量。

22、根据本发明的另一个方面，提供了一种基于提示工程和微调技术的文本生成系统，包括：

23、模型微调模块，用于根据目标场景的需求，采用微调技术对开源的embedding模型进行优化和微调；

24、向量化模块，用于将目标场景涉及的知识文本通过微调后的embedding模型转化为向量，之后存储在预设的向量数据库中；其中，知识文本包括问题和答案；

25、向量匹配模块，用于将用户问题通过微调后的embedding模型转化为问题向量，并在向量数据库中检索与问题向量相似度最高的向量，作为匹配向量；

26、提示词生成模块，用于将匹配向量转化为匹配文本，基于匹配文本、用户问题和知识文本，利用提示工程技术，生成符合目标场景需求的提示词；

27、答案生成模块，用于将提示词、匹配文本和用户问题一同送入预设的大语言模型，生成与用户问题匹配的答案；

28、其中，所述模型微调模块，具体用于：

29、根据目标场景的需求，确定目标场景下的查询数据以及与查询数据对应的正负样本；

30、基于查询数据和对应的正负样本，构建微调数据集；

31、将低秩适配法应用于开源的embedding模型的交叉注意力机制全连接层的权重矩阵上，基于构建的微调数据集，对开源的embedding模型进行优化和微调。

32、可选地，所述向量化模块，具体用于：

33、收集目标场景涉及的知识文本，并对知识文本进行断句处理，得到多个句子；

34、将每个句子进一步切分成单独的词语，在去除停用词后，对每个词语进行词性标注，确定每个词语的语义角色；

35、根据每个词语的语义角色，对断句得到的每个句子进行句法分析，确定每个句子中各个词语之间的语法关系；

36、通过语法关系和语义上下文信息，对断句得到的每个句子进行语义理解，确定每个句子的语义信息；

37、根据目标场景的任务需求以及每个句子的语义信息，对知识文本进行标注，确定知识文本的类别标签；

38、将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量。

39、可选地，所述将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量，具体包括：

40、将带有类别标签的知识文本按照预设长度进行分段处理；

41、将分段处理得到的各段知识文本分别送入微调后的embedding模型，得到多段文本向量。

42、根据本发明的又一个方面，提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行本发明上述任一方面所述的方法。

43、根据本发明的又一个方面，提供了一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述可执行指令以实现本发明上述任一方面所述的方法。

44、本发明基于微调技术，在冻结大语言模型参数的前提下，仅需训练少量额外参数即可实现专业问答领域适配，在达到与全量微调性能相当的同时，大大降低了计算和存储的开销。并且将提示词、匹配文本和用户问题一同送入预设的大语言模型，能够更好地捕捉问题和目标场景之间的语义关联，有效地利用了上下文信息，更深入地理解了复杂问题，能够更准确地提取关键信息，生成的答案更加符合目标场景的实际需求，任务执行高效。本发明通过知识文本绑定和提示词工程，增强了模型对专业问答领域知识的理解，提升了答案的准确性和丰富性，能够根据用户的问题和情况生成相应的解决方案和答案。从而解决现有的大语言模型在专业问答领域中存在任务执行较差、专业知识欠缺的技术问题。

技术特征：

1.一种基于提示工程和微调技术的文本生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将目标场景涉及的知识文本通过微调后的embedding模型转化为向量，具体包括：

3.根据权利要求2所述的方法，其特征在于，所述将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量，具体包括：

4.一种基于提示工程和微调技术的文本生成系统，其特征在于，包括：

5.根据权利要求4所述的系统，其特征在于，所述向量化模块，具体用于：

6.根据权利要求5所述的系统，其特征在于，所述将带有类别标签的知识文本送入微调后的embedding模型，得到对应的文本向量，具体包括：

7.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-3任一所述的方法。

8.一种电子设备，其特征在于，所述电子设备包括：

技术总结
本发明公开了一种基于提示工程和微调技术的文本生成方法及系统，属于自然语言处理技术领域。本发明基于微调技术，在冻结大语言模型参数的前提下，仅需训练少量额外参数即可实现专业问答领域适配，在达到与全量微调性能相当的同时，大大降低了计算和存储的开销。并且将提示词、匹配文本和用户问题一同送入预设的大语言模型，能够更好地捕捉问题和目标场景之间的语义关联，能够更准确地提取关键信息，生成的答案更加符合目标场景的实际需求，任务执行高效。通过知识文本绑定和提示词工程，增强了模型对专业问答领域知识的理解，提升了答案的准确性和丰富性。从而解决现有的大语言模型在专业问答领域中存在任务执行较差、专业知识欠缺的技术问题。

技术研发人员：蓝善根,杨国萍,吴丽娟,戚学前,孙小松,孙开华
受保护的技术使用者：贵州省通信产业服务有限公司
技术研发日：
技术公布日：2024/5/29

转载请注明原文地址:https://win.8miu.com/read-1150476.html

专利

最新回复(0)