一种基于理赔知识库字形匹配纠错方法、装置及系统与流程

专利检索2025-01-13  33


本发明涉及医疗健康理赔领域,特别涉及一种基于理赔知识库字形匹配纠错方法、装置及系统。


背景技术:

1、医疗健康理赔领域一般是指医疗保险、医疗赔偿和医疗索赔领域,医疗健康理赔领域的核心问题之一是如何高效地处理理赔申请,在保证准确性的同时提高效率,减轻人力负担,近年来,随着人工智能技术的不断成熟,医疗健康理赔领域也在逐渐运用人工智能算法和技术解决实际问题,实现智能的医疗健康理赔服务,提高理赔处理的效率和准确性;

2、现有的基于理赔知识库字形匹配纠错方法在对错误的文本进行纠错时,仅仅依靠字形的纠错方法,此方法不仅效率低下,还会使得字形的纠错成功率低下,进而使得用户的使用满意度大幅降低,此外,现有的纠错系统在对每个用户使用结束后,无法做到对其进行使用反馈收集,使得无法得到每个用户的使用反馈,进而无法有效的发现纠错过程中的弊端,继而无法有效的对其纠错方法进行完善和升级。


技术实现思路

1、本发明的主要目的在于提供一种基于理赔知识库字形匹配纠错方法、装置及系统,可以有效解决背景技术中的技术问题。

2、为实现上述目的,本发明采取的技术方案为:

3、一种基于理赔知识库字形匹配纠错方法,该所述基于理赔知识库字形匹配纠错方法具体包括如下步骤:

4、s1、创建医疗健康理赔知识库;

5、s2、文本语句逐字拆解;

6、s3、字形匹配;

7、s4、语义模型纠错;

8、s5、纠错输出;

9、s6、用户反馈收集;

10、s7、用户反馈学习。

11、作为本发明的进一步方案,所述创建医疗健康理赔知识库的具体实施步骤如下:

12、s11、需要从医疗健康领域和理赔领域中收集数据,包括正确的汉字字形、词汇、常用语、专业术语;

13、s12、将收集到的数据进行清洗和预处理,包括去除冗余信息、统一格式和标准、去除错误数据;

14、s13、定期对词库和语义模型进行优化和更新,包括添加新的常用汉字、词汇和专业术语、修正错误的字形、语义信息;

15、需说明的是,创建一个准确和完整的医疗健康理赔知识库是该方法的基础之一,需要经过反复的收集、清洗和优化。

16、作为本发明的进一步方案,所述文本语句逐字拆解的具体实施步骤如下:

17、s21、将待纠错的文本逐字拆解成单个字形,这通过分解汉字的基本组件和笔画来实现,包括但不限于将“医疗保险”拆成“医”“疗”“保”“险”;

18、s22、将拆解后的字形保存在系统中,以供后续的字形匹配和语义纠错使用;

19、s23、设置一个规则停用列表,去除在医疗健康理赔知识库中已存在和不需要纠错的字形,包括标点符号、数字;

20、s24、在拆解过程中,需要准确判断每个字形的重要特征,包括笔画数、笔画顺序、偏旁部首;

21、需说明的是,文本逐字拆解是该方法中一个很重要的步骤,只有拆分成单个字形后,才能进行后续的字形匹配和纠错,在拆解过程中,需要注意保留关键信息,并合理地去除不需要纠错的字形,以提高效率和准确性。

22、作为本发明的进一步方案,所述字形匹配的具体实施步骤如下:

23、s31、从逐字拆解的结果中,取出一个待匹配的字形;

24、s32、通过使用字形特征匹配算法将待匹配的字形与医疗健康理赔知识库中的字形进行比对;

25、s321、所述字形特征匹配算法的具体内容为,

26、mm=1-|m-n|/max(m,n);

27、ma=|a∩b|/|a∪b|;

28、mp=|p∩q|/|p∪q|;

29、ms=|s∩t|/|s∪t|;

30、其中,mm为笔画数匹配程度,m为待匹配字形的笔画数,n为知识库中字形的笔画数,ma为字形基本组件配合程度,a为待匹配字形的基本组件集合,b为知识库中字形的基本组件集合,mp为偏旁部首匹配程度,p为待匹配字形的偏旁部首集合,q为知识库中字形的偏旁部首集合,ms为笔画顺序匹配程度,s为待匹配字形的笔画顺序集合,t为知识库中字形的笔画顺序集合。

31、s33、设置一个阈值,并根据计算得到的相似度,保留相似度超过阈值的字形;

32、s34、根据找到的最相似字形的相似度,进行匹配度评估,当匹配度高时,进行字形更换,并纠错输出,当匹配度低时,将待纠错字形输出至下一步骤;

33、需说明的是,字形匹配是对待纠错的字形进行与知识库中字形的对比和匹配,以找出最相似的字形,通过匹配度评估,判断匹配结果是否满足要求,并决定是否需要进一步进行纠错。

34、作为本发明的进一步方案,所述语义模型纠错的具体实施步骤如下;

35、s41、构建一个包含正确文本和错误文本的语料库,其中错误文本是包含常见错误的文本,也是人工制造的错误文本,正确文本用于作为对照组进行对比分析;

36、s42、对语料库进行预处理,包括分词、标注词性、分析语法结构;

37、s43、使用预处理后的语料库训练一个语义模型算法;

38、s44、使用训练好的语义模型算法对字形特征匹配度低的文本进行检测,找出存在错误的部分,语义模型分析文本中的语义关系和上下文信息,辅助判断是否存在错误,并确定可能的错误位置;

39、s45、针对检测到的错误,通过语义模型算法进行错误纠正并完成输出;所述语义模型算法的具体内容为,

40、pij=p(j|i)=xij/xi;

41、j=σ(wi,wj∈v)f(xij)(wi*wj+ki+kj-lnxij)^2;

42、f(xij)=min{1,(xmax/xij)^α};

43、其中,wi和wj表示语料库中的两个单词,xij表示单词wi和wj的共现次数,xi表示wi的总共现次数,p(j|i)表示给了一个确定的单词wi的情况下,单词wj在上下文中出现的联合概率,wi*wj表示单词wi和wj的向量乘积,ki和kj表示单词wi和wj的偏置项,lnxij表示共现次数xij的对数值,f(xij)表示带权函数,用于平衡高频词和低频词的权重,xmax是一个截断参数,控制了函数的上限,避免过大的权重,α是一个指数参数,用于控制权重的幅度;

44、需说明的是,语义模型纠错尝试通过理解文本的语义,发现并纠正文本中的错误,该过程主要依赖于收集语料库、预处理数据和训练语义模型。

45、作为本发明的进一步方案,所述纠错输出的具体实施步骤如下:

46、s51、将字形纠错完成的语句和语义纠错完成的语句再进一步确认其准确性;

47、s52、当发现纠错失败,依旧存在错误后,再将语句通过对应的纠错方法进行纠错,并重复以上操作,直至未发现纠错失败,此时,再将语句进行输出。

48、作为本发明的进一步方案,所述用户反馈收集的具体实施步骤如下:

49、s61、为用户提供反馈的渠道,在产品和服务中添加反馈按钮和链接,以及在网站、应用程序和平台上创建反馈表单;

50、s62、激励用户主动提供反馈,通过弹窗、推送通知、电子邮件和其他方式定期提醒用户提供反馈,并提供简单明了的指示,告诉用户如何提供反馈,鼓励用户分享意见、建议和问题;

51、s63、确保收集用户反馈的过程简单、直观,并尽准确地捕捉用户的意见和问题;

52、s64、将收集到的用户反馈进行分类和管理;

53、需说明的是,通过以上步骤,可以有效地收集用户的反馈,并将其转化为有价值的信息和改进措施,不仅可以提高产品或服务的质量,还可以增强用户的满意度和忠诚度。

54、作为本发明的进一步方案,所述用户反馈学习的具体实施步骤如下:

55、s71、对分类管理完成的用户反馈进行分析

56、s72、当用户反馈此次服务的结果为正确时,将此次纠错过程保存至知识库中,以此扩充知识库,

57、s73、当用户反馈此次服务的结果为错误时,将此次纠错过程进行分析处理,并重新对其进行字形纠错和语义纠错,以此来完善的提高理赔知识库字形匹配纠错方法;

58、s74、根据不同的用户提供的用户反馈及时回应;

59、需说明的是,通过上述步骤可以对字形纠错方法进行完善,使得字形纠错方法对字形的纠错更加准确,并且使得字形纠错方法更加迅速且全面,此外,还使得知识库的内容得到扩充。

60、一种基于理赔知识库字形匹配纠错系统,所述系统包括如下内容:

61、输入模块,该模块负责接收用户的输入;

62、预处理模块,该模块负责对输入的文本进行预处理,包括对文本语句进行逐字拆解;

63、字形匹配纠错模块,该模块负责对文本进行字形特征匹配纠错;

64、语义模型纠错模块,该模块负责通过使用语义模型算法进行文本纠错;

65、纠错输出模块,该模块负责将纠错完成的文本返还给用户;

66、用户反馈收集模块,该模块负责将用户的反馈意见进行收集,并进行分类和整理;

67、用户反馈学习模块,该模块负责根据用户反馈对字形纠错方法进行完善和扩充医疗健康理赔知识库。

68、一种基于理赔知识库字形匹配纠错装置,所述装置包括如下内容:所述装置是用于执行基于理赔知识库字形匹配纠错系统。

69、本发明的有益效果如下:

70、通过设置语义模型纠错步骤,使得语义模型可以通过分析文本中的语义关系和上下文信息,辅助判断可能存在的错误位置,并进行错误纠正,相较于仅仅基于字形的纠错方法,语义模型更能理解文本的含义,准确判断错误的存在与否,从而提高纠错的准确性;

71、并且,语义模型可以发现并纠正一些字形匹配度较高但语义错误的情况,因此避免了仅仅依靠字形纠错的误纠错,从而降低了文本的误纠错率;

72、通过设置用户反馈收集步骤,通过用户反馈收集,可以了解用户对系统的需求和期望,以及他们在使用过程中遇到的问题和困惑,因此有助于收集用户意见和建议,帮助系统运营方更好地了解用户需求,优化系统功能、改进用户体验;

73、并且通过收集用户反馈,系统运营维持方可以表达对用户的关注和重视,使用户感受到参与和影响产品发展的机会,因此有助于建立良好的用户关系,提升用户的忠诚度和使用黏性;

74、通过设置用户反馈学习步骤,通过分析和学习用户的反馈,系统可以了解用户遇到的问题、需求和痛点,系统可以利用这些反馈信息来不断改进算法、更新知识库,并提供更准确、更满足用户需求的回答,从而不断优化系统和服务质量。


技术特征:

1.一种基于理赔知识库字形匹配纠错方法,其特征在于:该所述基于理赔知识库字形匹配纠错方法具体包括如下步骤:

2.根据权利要求1所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述创建医疗健康理赔知识库的具体实施步骤如下:

3.根据权利要求2所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述文本语句逐字拆解的具体实施步骤如下:

4.根据权利要求3所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述字形匹配的具体实施步骤如下:

5.根据权利要求4所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述语义模型纠错的具体实施步骤如下;

6.根据权利要求5所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述纠错输出的具体实施步骤如下:

7.根据权利要求1所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述用户反馈收集的具体实施步骤如下:

8.根据权利要求1所述的一种基于理赔知识库字形匹配纠错方法,其特征在于:所述用户反馈学习的具体实施步骤如下:

9.一种基于理赔知识库字形匹配纠错系统,其特征在于:所述系统包括如下内容:

10.一种基于理赔知识库字形匹配纠错装置,其特征在于:所述装置包括如下内容:所述装置是用于执行权利要求8中的所述基于理赔知识库字形匹配纠错系统。


技术总结
本发明公开了一种基于理赔知识库字形匹配纠错方法、装置及系统,本发明涉及医疗健康理赔领域,该所述基于理赔知识库字形匹配纠错方法具体包括如下步骤,创建医疗健康理赔知识库、文本语句逐字拆解、字形匹配、语义模型纠错、纠错输出、用户反馈收集和用户反馈学习,所述创建医疗健康理赔知识库的具体实施步骤如下,需要从医疗健康领域和理赔领域中收集数据,包括正确的汉字字形、词汇、常用语和专业术语,将收集到的数据进行清洗和预处理,包括去除冗余信息、统一格式和标准以及去除错误数据,定期对词库和语义模型进行优化和更新,通过设置语义模型纠错步骤,提高了纠错的准确性。

技术研发人员:张博,徐伟男,周明强
受保护的技术使用者:上海商保通健康科技有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1148585.html

最新回复(0)