一种基于大语言模型的文案扩展方法及系统与流程

专利检索2025-11-28  1


本发明涉及数据处理,具体而言,涉及一种基于大语言模型的文案扩展方法及系统。


背景技术:

1、文案本意是指放书的桌子,后来指在桌子上写字的人。现在指的是公司或企业中从事文字工作的职位,就是以文字来表现已经制定的创意策略。文案是一个与广告创意先后相继呈现的表现过程、发展过程与深化过程, 多存在于广告公司,企业宣传与新闻策划工作等。

2、尤其随着互联网商业的发展,文案工作也越来越讲究实时性和准确性。目前,文案工作基本上都是人工进行编制,因为造成文案的生成效率差。当然,目标也出现了ai代替人进行文案创作的技术,但这种方式属于从零开始的直接创作,针对特定内容或者要求的文案来说就不能够得到充分的满足,尤其是在已有的文案上进行扩充,不具有较强的扩充适应性。

3、因此,设计一种基于大语言模型的文案扩展方法及系统,通过大语言模型实现对文案的高效扩充,切实保证扩充文案的适用性,是目前亟待解决的问题。


技术实现思路

1、本发明的目的在于提供一种基于大语言模型的文案扩展方法,通过先获取用于训练建立适用性较强的大语言模型的历史基础数据,从文案的类型和以扩展方向作为训练特征数据提取的依据,能够充分的训练出适应不同文案类型的扩展模型,进而能够高效快速的对目标文案进行扩展。基于文案类型和扩展方向的考虑可以充分的把握扩展的主体内容,使形成的扩展内容既符合文案的类型也展现当前文案的中心内容,保证文案的高效扩展和扩展后的文案的适用性。

2、本发明的目的还在于提供一种基于大语言模型的文案扩展系统,通过文案数据采集单元、语言模型训练单元以及文案扩展单元组成简单且高效的大语言模型文案扩展系统。从文案扩展所需的语言模型的基础数据获取到数据的特征信息提取以及训练形成合理的文案扩展模型实现对文案的完整扩展,为文案扩展处理提供了重要的物质基础。

3、为解决上述技术问题,本发明提供如下技术方案:

4、第一方面,本发明提供一种基于大语言模型的文案扩展方法,包括获取历史标定文案数据,进行基于模板类型的扩展内容划分,形成文案类型内容集;根据文案类型内容集,进行基于非特定句段的语言模型训练,形成文案扩展语言模型;获取目标扩展文案,根据文案类型内容集进行基于文案扩展语言模型的扩展方向分析,形成目标扩展方向信息;根据目标扩展方向信息,对目标扩展文案进行文案扩展,形成完成目标文案。

5、在本发明中,该方法通过先获取用于训练建立适用性较强的大语言模型的历史基础数据,从文案的类型和以扩展方向作为训练特征数据提取的依据,能够充分的训练出适应不同文案类型的扩展模型,进而能够高效快速的对目标文案进行扩展。基于文案类型和扩展方向的考虑可以充分的把握扩展的主体内容,使形成的扩展内容既符合文案的类型也展现当前文案的中心内容,保证文案的高效扩展和扩展后的文案的适用性。

6、可选地,所述获取历史标定文案数据,进行基于模板类型的扩展内容划分,形成文案类型内容集,包括:

7、获取历史标定文案数据,根据类型标定确定文案的不同类型; 对每个文案类型进行基于内容方向的特征分析,形成每个文案类型对应的类型方向集;结合每个类型方向集,形成文案类型集,其中,n为不同文案类型的编号,an表示类型编号为n的文案类型,且,表示类型编号为n的文案类型中编号为k的类型方向集。

8、在本发明中,对历史标定文案数据的分析,主要是获取用于训练语言模型的基础数据。这里需要考虑的一个重要方面是如何对历史标定文案数据进行合理的特征信息提取才能够有利于语言模型的优化,形成优化的文案扩展模型。本发明考虑从文案类型和文案撰写方向来入手,一方面文案的类型基本决定了文案撰写的风格、撰写的主体,甚至是文案撰写的中心内容。而文案撰写的方向则是考虑不同类型的文案都基本具有撰写的规律性,对文案的补充大部分是基于这种撰写规律来进行的,毕竟脱离了这些撰写规律所撰写的文案是没有条理性的,容易造成信息的缺失。所以针对不同文案类型,应该需要确定完整的内容方向,进而避免扩展时因为没有扩展的规律可循导致扩展时间长而降低效率,同时也避免造成模型优化的效果不佳形成的扩展内容与需求不贴合的情况。

9、可选地,所述对每个文案类型进行基于内容方向的特征分析,形成每个文案类型对应的类型方向集,包括:

10、获取历史标定文案数据中为相同文案类型的文案数据,形成同类型历史文案标定数据;对同类型历史文案标定数据中的每个文案进行标定方向的提取,形成每个文案的方向信息;对所有同类型历史文案标定数据中的文案的方向信息进行基于类型方向的并运算,形成对应类型的类型方向集;获取同类型历史文案标定数据中不同文案的相同类型方向数据,形成同类型历史方向内容信息;对不同同类型历史方向内容信息进行基于共通特征词的统计分析,形成方向特征词集;对不同同类型历史方向内容信息进行基于定型特征句式的统计分析,形成方向特征句式集;对每个同类型历史方向内容信息,进行基于方向特征词集中特征词和方向特征句式集中特征句式的排除,形成方向语义内容集;集合每个类型方向的方向特征词集、方向特征句式集以及方向语义内容集于对应的类型方向集中。

11、在本发明中,对每个文案类型进行特征信息的提取,主要包括的内容有用于识别方向类型的特征词集,用于进行扩展式展现扩展的方向的标志性方向特征句式集以及扩展时能够完全贴合实际文案内容的语义内容集。针对三个不同的特征信息提取方面,考虑三种特征信息的使用方式以及所要表达的信息不同,因而他们各自形成处理的方式也各不相同。

12、可选地,所述对不同同类型历史方向内容信息进行基于共通特征词的统计分析,形成方向特征词集,包括:

13、对每个同类型历史方向内容信息进行非通用词的用词统计,并按照统计量由大到小的顺序对非通用词进行排序,形成非通用词统计顺序信息;设定重复限值α,对每个同类型历史方向内容信息中排序的非通用词进行以下方式的重复性统计分析:将进行分析的同类型历史方向内容信息对应的非通用词统计顺序信息确定为目标非通用词统计顺序;按照统计量由大到小的顺序从目标非通用词统计顺序中依次获取统计量对应的目标非通用词和目标非通用词对应的统计量,其中,i表示目标非通用词统计顺序中目标非通用词的顺序编号;获取目标非通用词在其他同类型历史方向内容信息中的出现次数,并进行以下判断:若,则将目标非通用词确定为特征词;若,则将目标非通用词确定为非特征词;保留所有的特征词,形成方向特征词集。

14、在本发明中,对于方向特征词集的获取,主要是通过对非通用词在文案中的使用量情况来确定的。对于非通用词的识别可以人工进行核实,也可以建立合理的非通用词识别库来实现对非通用词的识别。需要说明的是,对于特征词来说就是基本上主要出现在当前方向上,而较少或者基本不会出现在其他方向的描述中。这里通过设定重复限制来对可能的非通用词进行判断,简单高效的实现对特征词的有效确定。

15、可选地,所述对不同同类型历史方向内容信息进行基于定型特征句式的统计分析,形成方向特征句式集,包括:

16、设定重复率阈值β和重复量阈值η,对每个同类型历史方向内容信息中的所有句子进行以句子为单位的以下重复率对比判断:将进行分析判断的句子确定为目标分析句子;若存在与目标分析句子的字数重复率超过重复率阈值β,且超过重复率阈值β的句子数量超过重复量阈值η,则去除目标分析句子中未重复的词形成方向特征句式,反之则否定目标分析句子为方向特征句式;集合所有的方向特征句式,形成方向特征句式集。

17、在本发明中,方向特征句式意为该句式会经常出现在对应的方向内容中。方向特征句式主要是确定固定的句式形式,进而作为文案扩展时进行对应方向的内容的开启、总述、特定情境描述等具有代表性内容的确定。支撑文案扩展具有合理的文案撰写规律。在进行方向特征句式的采集时,需要注意将句式中对应的不发生重复,具有高度可调整可改变的内容信息,这些信息一方面有利于后续语言模型进行优化学习,进而实现在特定方向句式下合理的进行内容描述,提高扩展的适用性和高效性,另一方面也是排除对于特征句式的判断。

18、可选地,所述根据文案类型内容集,进行基于非特定句段的语言模型训练,形成文案扩展语言模型,包括:

19、获取文案类型内容集中的方向语义内容集,形成方向语义训练集;获取文案类型内容集中的方向特征句式集,形成句式语义训练集;用方向语义训练集进行方向语义扩展的语言模型训练,形成方向语义扩展语言模型;用句式语义训练集进行句式语义补充的语言模型训练,形成句式语义补充语言模型。

20、在本发明中,这里,对于语言模型的优化训练主要是两个方面,一个是基于文案扩展的方向语义训练。大部分的方向语义内容作为在方向上扩展的主要内容,需要单独进行基于语义的训练,保证模型在获得目标扩展文案的内容时能够做出更加贴合文案内容的语句描述。另一个是句式语义补充语言模型,该模型主要是针对方向特征句式来建立的,相比于语义模型,补充模型需要来具有句式格式的情况下完成对句式中需要贴合文案内容的描述的确定,通过对历史数据的提取可以充分提供足够的训练数据合理的优化句式语义补充语言模型。

21、可选地,所述获取目标扩展文案,根据文案类型内容集进行基于文案扩展语言模型的扩展方向分析,形成目标扩展方向信息,包括:

22、获取目标扩展文案,进行文案类型标定,形成目标扩展文案类型;根据目标扩展文案类型,获取对应类型方向集中的方向特征词集、方向特征句式集;根据方向特征词集,对目标扩展文案进行扩展方向的确定;根据扩展方向和方向特征句式集,结合句式语义补充语言模型进行扩展方向的方向特征句式的扩展,形成特征句式扩展内容;根据扩展方向,结合方向语义扩展语言模型进行扩展方向的方向语义扩展,形成方向语义扩展内容。

23、在本发明中,对目标扩展文案的处理首先是要确定目标扩展文案的文案类型,然后结合文案类型对类型下的方向进行对比,确定文案没有的方向,进而针对性的进行基于文案方向的内容扩展。扩展的内容根据语义补充语言模型和方向语义扩展模型来确定,高效且快速。

24、可选地,所述根据方向特征词集,对目标扩展文案进行扩展方向的确定,包括:设定使用率阈值γ,对目标扩展文案进行以下基于方向特征词集中的方向特征词的使用率对比判断:若目标扩展文案中的出现的方向特征词集中的方向特征词的数量与方向特征词集中所有方向特征词的数量的比值大于等于使用率阈值γ,则确定目标扩展文案已存在对应的类型方向;若目标扩展文案中的出现的方向特征词集中的方向特征词的数量与方向特征词集中所有方向特征词的数量的比值小于使用率阈值γ,则确定目标扩展文案不存在对应的类型方向;结合所有不存在的类型方向,确定为扩展方向。

25、在本发明中,对目标扩展文案的扩展方向确定是利用每个方向上的特征词集进行对比来确认的。使用率阈值γ根据实际需要来进行调整和确定。在目标扩展文案中出现的某个方向上的方向特征词的对应的方向特征词集中达到了一定的重合程度可以认为目标扩展文案是具有对应方向的。进而能够快速高效的确定目标扩展文案所具有的扩展方向和对应的未具有的扩展方向。

26、可选地,所述根据目标扩展方向信息,对目标扩展文案进行文案扩展,形成完成目标文案,包括:将所有扩展方向上获取的特征句式扩展内容和方向语义扩展内容集合,形成完成目标文件。

27、在本发明中, 通过训练后的扩展模型将所需扩展的内容通过合理的描述表达顺序或者扩展所需的格式形式完成目标文件的扩展。

28、第二方面,本发明提供一种基于大语言模型的文案扩展系统,用于实现第一方面所说的一种基于大语言模型的文案扩展方法,包括:

29、文案数据采集单元,用于获取历史标定文案数据和目标扩展文案;

30、语言模型训练单元,用于获取所述文案数据采集单元中的历史标定文案数据,进行基于模板类型的扩展内容划分,形成文案类型内容集;根据所述文案类型内容集,进行基于非特定句段的语言模型训练,形成文案扩展语言模型;

31、文案扩展单元,用于获取所述文案数据采集单元中的目标扩展文案,根据所述文案类型内容集进行基于文案扩展语言模型的扩展方向分析,形成目标扩展方向信息,并根据所述目标扩展方向信息,对所述目标扩展文案进行文案扩展,形成完成目标文案。

32、在本发明中,该系统通过文案数据采集单元、语言模型训练单元以及文案扩展单元组成简单且高效的大语言模型文案扩展系统。从文案扩展所需的语言模型的基础数据获取到数据的特征信息提取以及训练形成合理的文案扩展模型实现对文案的完整扩展,为文案扩展处理提供了重要的物质基础。

33、本发明提供的技术方案带来的有益效果至少包括:

34、本发明所述方法通过先获取用于训练建立适用性较强的大语言模型的历史基础数据,从文案的类型和以扩展方向作为训练特征数据提取的依据,能够充分的训练出适应不同文案类型的扩展模型,进而能够高效快速的对目标文案进行扩展。基于文案类型和扩展方向的考虑可以充分的把握扩展的主体内容,使形成的扩展内容既符合文案的类型也展现当前文案的中心内容,保证文案的高效扩展和扩展后的文案的适用性。

35、本发明所述系统通过文案数据采集单元、语言模型训练单元以及文案扩展单元组成简单且高效的大语言模型文案扩展系统。从文案扩展所需的语言模型的基础数据获取到数据的特征信息提取以及训练形成合理的文案扩展模型实现对文案的完整扩展,为文案扩展处理提供了重要的物质基础。


技术特征:

1.一种基于大语言模型的文案扩展方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的文案扩展方法,其特征在于,所述获取历史标定文案数据,进行基于模板类型的扩展内容划分,形成文案类型内容集,包括:

3.根据权利要求2所述的基于大语言模型的文案扩展方法,其特征在于,所述对每个文案类型进行基于内容方向的特征分析,形成每个所述文案类型对应的类型方向集,包括:

4.根据权利要求3所述的基于大语言模型的文案扩展方法,其特征在于,所述对不同所述同类型历史方向内容信息进行基于共通特征词的统计分析,形成方向特征词集,包括:

5.根据权利要求3所述的基于大语言模型的文案扩展方法,其特征在于,所述对不同所述同类型历史方向内容信息进行基于定型特征句式的统计分析,形成方向特征句式集,包括:

6.根据权利要求5所述的基于大语言模型的文案扩展方法,其特征在于,所述根据所述文案类型内容集,进行基于非特定句段的语言模型训练,形成文案扩展语言模型,包括:

7.根据权利要求6所述的基于大语言模型的文案扩展方法,其特征在于,所述获取目标扩展文案,根据所述文案类型内容集进行基于文案扩展语言模型的扩展方向分析,形成目标扩展方向信息,包括:

8.根据权利要求7所述的基于大语言模型的文案扩展方法,其特征在于,所述根据所述方向特征词集,对所述目标扩展文案进行扩展方向的确定,包括:

9.根据权利要求8所述的基于大语言模型的文案扩展方法,其特征在于,所述根据所述目标扩展方向信息,对所述目标扩展文案进行文案扩展,形成完成目标文案,包括:

10.一种基于大语言模型的文案扩展系统,用于实现如权利要求1-9中任一项所述的方法,其特征在于,包括:


技术总结
本发明提供一种基于大语言模型的文案扩展方法及系统,涉及数据处理技术领域。所述方法包括:获取历史标定文案数据,进行基于模板类型的扩展内容划分,形成文案类型内容集;根据文案类型内容集,进行基于非特定句段的语言模型训练,形成文案扩展语言模型;获取目标扩展文案,根据文案类型内容集进行基于文案扩展语言模型的扩展方向分析,形成目标扩展方向信息;根据目标扩展方向信息,对目标扩展文案进行文案扩展,形成完成目标文案。本发明通过大语言模型实现对文案的高效扩充,切实保证扩充文案的适用性。

技术研发人员:屠静,王亚,赵策,李伟伟,周勤民,张玥,雷媛媛,孙岩,潘亮亮
受保护的技术使用者:卓世未来(天津)科技有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1158936.html

最新回复(0)