本发明涉及大数据分析,尤其涉及一种基于大数据的上市公司财务危机预警方法及系统。
背景技术:
1、传统的财务危机预警体系从早期的只考虑财务指标,导致危机预警结果可信度不足,预警系统应用效果不佳。随着相关危机预警理论研究的不断完善,财务危机预警体系兼顾公司治理结构与宏观经济发展等非财务指标。不管是何种情况,现有预警体系都是以财务指标作为主体,非财务指标只是起到辅助或补充的作用,这既不符合财务危机发生根源问题,也不符合危机治理的原则。财务指标的恶化,意味着企业经营不善,甚至破产或是倒闭。但财务指标恶化是经营不善的结果,不仅仅是经营不善的原因,其对财务危机预警只能起到征兆的作用,并不能揭示危机发生的根源。行业竞争、国家政策、行业发展趋势、管理层应对危机的能力、宏观经济发展态势转变等作为非财务因素,因其不方便量化或不好精确把握,很少有研究者将其纳入财务危机预警体系,这种情况导致现有财务危机预警体系并不完善,适用性也较差。如果只以财务指标为主体来判断公司经营困境,所搭建的财务预警体系也是与实际脱节,难以在实际中得到广泛应用。
技术实现思路
1、本发明为解决上述技术问题,提出了一种基于大数据的上市公司财务危机预警方法及系统,以解决至少一个上述技术问题。
2、本技术提供了一种基于大数据的上市公司财务危机预警方法,应用于大数据平台,包括以下步骤:
3、步骤s1:获取网络舆情数据;
4、步骤s2:对网络舆情数据进行网络舆情数据预处理,得到网络舆情预处理数据;
5、步骤s3:对网络舆情预处理数据进行舆情关联度处理,得到网络舆情关联度数据;
6、步骤s4:根据网络舆情关联度数据对网络舆情预处理数据进行网络舆情情感分析,得到网络舆情情感数据;
7、步骤s5:根据网络舆情情感数据以及网络舆情关联度数据对网络舆情预处理数据进行财务危机预警模型构建,得到财务危机预警模型,以进行财务危机预警作业。
8、本发明中通过获取网络舆情数据,该方法能够利用传统的财务数据以及互联网上的舆情信息,为财务危机预警提供更加贴合实际的信息源,舆情数据反映了市场和公众对公司的看法和态度,有助于了解公司的声誉和风险状况。对网络舆情数据进行预处理和关联度处理,有助于减少噪声信息和冗余信息,提取出与财务危机相关的关键信息。通过情感分析,可以更加深入地理解舆情数据中蕴含的情感和态度,从而识别出潜在的财务危机信号,例如,对负面情感的舆情预示着公司面临财务风险或声誉损害。基于网络舆情情感数据和关联度数据,构建财务危机预警模型,有助于提前识别潜在的财务危机,并采取相应的应对措施,结合舆情信息和财务数据,提高预警的准确性和及时性。通过财务危机预警模型,可以及时发现潜在的财务风险,从而采取针对性的风险防范和管理措施,降低财务危机发生的可能性。
9、可选地,步骤s1具体为:
10、步骤s11:通过网络舆情采集引擎进行网络舆情数据采集并筛选,得到初步网络舆情数据;
11、步骤s12:对初步网络舆情数据进行语义扩展处理,得到网络舆情数据。
12、本发明中通过网络舆情采集引擎进行网络舆情数据采集并筛选,得到初步网络舆情数据,利用网络舆情采集引擎从互联网上收集与公司相关的舆情信息,并进行筛选和过滤,从而获取初步的网络舆情数据。对初步网络舆情数据进行语义扩展处理,得到网络舆情数据。在这一步骤中,对初步获取的网络舆情数据进行语义扩展处理,包括实体识别、关键词提取、情感分析等,从而丰富文本信息,使其更具有语义深度和丰富度,通过语义扩展处理,可以深入地理解舆情数据中蕴含的信息,识别出与财务危机相关的关键信息,为财务危机预警模型构建提供更加准确的数据支持。
13、可选地,其中初步网络舆情数据包括潜在相关筛选数据以及表面相关筛选数据,步骤s11具体为:
14、步骤s111:通过网络舆情采集引擎进行网络舆情数据采集,得到原始网络舆情数据;
15、步骤s112:对原始网络舆情数据进行潜在相关筛选,得到潜在相关筛选数据;
16、步骤s113:对原始网络舆情数据进行表面相关筛选,得到表面相关筛选数据。
17、本发明中通过网络舆情采集引擎进行网络舆情数据采集,得到原始网络舆情数据,利用网络舆情采集引擎从互联网上获取与公司相关的各种舆情信息,包括新闻报道、社交媒体评论、用户留言等各种形式的数据。对原始网络舆情数据进行潜在相关筛选,得到潜在相关筛选数据。在这一步骤中,对原始网络舆情数据进行筛选和过滤,将与公司潜在相关的信息提取出来。潜在相关的信息指的是虽然没有明确提及公司名称或相关实体,但其中包含了与公司相关的话题、行业动态或事件等内容。对原始网络舆情数据进行表面相关筛选,得到表面相关筛选数据。对原始网络舆情数据进行进一步筛选和过滤,将直接涉及到公司名称或相关实体的信息提取出来。表面相关的信息指的是明确提及了公司名称或相关实体的内容。
18、可选地,步骤s112具体为:
19、步骤s114:对原始网络舆情数据进行主体识别以及关键词提取,分别得到原始网络舆情主体数据以及原始网络舆情关键词数据;
20、步骤s115:对原始网络舆情主体数据以及原始网络舆情关键词数据进行潜在关联性评估,得到潜在关联性评估数据;
21、步骤s116:根据潜在关联性评估数据对原始网络舆情主体数据以及原始网络舆情关键词数据进行实体关系推测,得到实体关系推测数据;
22、步骤s117:根据原始网络舆情主体数据、原始网络舆情关键词数据以及实体关系推测数据进行潜在关联度计算并过滤,得到潜在相关筛选数据;
23、其中潜在关联性评估包括以下步骤:
24、对原始网络舆情主体数据以及原始网络舆情关键词数据进行文本解析,得到文本解析数据;
25、对文本解析数据进行关键信息提取,得到关键信息数据;
26、对关键信息数据进行逻辑关系识别,得到逻辑关系数据;
27、对逻辑关系数据进行关联性评估,得到潜在关联性评估数据。
28、本发明中对原始网络舆情数据进行主体识别和关键词提取,分别得到原始网络舆情主体数据和原始网络舆情关键词数据,反映出舆情中涉及的主体实体以及关键词。对原始网络舆情主体数据和原始网络舆情关键词数据进行潜在关联性评估,包括文本解析、关键信息提取、逻辑关系识别和关联性评估等子步骤,旨在识别文本数据之间的潜在关联关系。根据潜在关联性评估的结果,对原始网络舆情主体数据和原始网络舆情关键词数据进行实体关系推测,通过推测实体之间的关系,可以进一步挖掘文本数据中的潜在关联性,为潜在相关筛选数据的生成提供支持。根据潜在关联性评估数据,对原始网络舆情主体数据、原始网络舆情关键词数据以及实体关系推测数据进行潜在关联度计算并过滤,得到潜在相关筛选数据,以识别出与公司相关但未直接提及公司名称的信息,提高数据的准确性和质量。
29、可选地,步骤s113具体为:
30、对原始网络舆情数据进行实体识别以及命名实体抽取,得到实体数据以及命名实体数据;
31、根据实体数据以及命名实体数据进行实体关系分析,得到实体关系分析数据;
32、对实体关系分析数据进行实体关联度计算并过滤,得到表面相关筛选数据。
33、本发明中对原始网络舆情数据进行实体识别和命名实体抽取,分别得到实体数据和命名实体数据。实体数据指的是识别出的文本中的实体对象,而命名实体数据则是从文本中提取出的具有特定名称的实体对象,如公司名、人名等。根据实体数据和命名实体数据进行实体关系分析,即分析不同实体之间的关系,旨在识别出文本数据中不同实体之间的关联关系,例如公司与股东之间的关系、公司与竞争对手之间的关系等。对实体关系分析数据进行实体关联度计算并过滤,得到表面相关筛选数据。根据实体之间的关联程度进行计算,并过滤掉关联度较低的实体,以获得与公司直接相关的信息,即表面相关的数据。
34、可选地,步骤s12具体为:
35、步骤s121:对初步网络舆情数据进行实体关系抽取,得到实体关系数据;
36、步骤s122:对实体关系数据进行语义链接处理,得到语义链接数据;
37、步骤s123:对语义链接数据进行同义词扩展,得到同义词扩展数据;
38、步骤s124:对同义词扩展数据进行词汇增强,得到网络舆情数据。
39、本发明中对初步网络舆情数据进行实体关系抽取,即识别和提取文本中不同实体之间的关系,包括公司与员工、公司与竞争对手、公司与产品等各种关系。对实体关系数据进行语义链接处理,即通过语义分析技术将相关的实体关系连接起来,形成更加完整的语义网络,深入理解文本数据中的语义关系,为同义词扩展提供基础。对语义链接数据进行同义词扩展,即根据语义关系找到与关键词相关的同义词,并将其扩展到原始数据中,丰富文本数据的内容,增加了数据的多样性和丰富性。对同义词扩展数据进行词汇增强,即通过添加与关键词相关的词汇或短语,进一步丰富了文本数据的内容,有助于提高文本数据的语义深度和丰富度,使其更具有表达力和信息量。
40、可选地,步骤s3具体为:
41、对网络舆情预处理数据进行关键词提取并短语识别,得到网络舆情关键词数据以及网络舆情短语数据;
42、对网络舆情关键词数据以及网络舆情短语数据进行相关性计算并权重赋值处理,得到网络舆情加权数据;
43、对网络舆情加权数据进行主题聚类分析,得到网络舆情主题聚类数据;
44、对网络舆情主题聚类数据进行共现图构建,得到网络舆情共现图数据;
45、对网络舆情共现图数据进行语义相似度计算,得到网络舆情语义相似度数据;
46、根据网络舆情语义相似度数据进行关联处理,网络舆情关联度数据。
47、本发明中对网络舆情预处理数据进行关键词提取,并识别其中的短语,能够准确地反映出文本的重要内容和主题。对网络舆情关键词数据和短语数据进行相关性计算,并对相关性进行权重赋值处理,可以衡量不同关键词和短语之间的相关程度,并根据其重要性赋予相应的权重,以区分其在舆情中的重要程度。对网络舆情加权数据进行主题聚类分析,即将相关的关键词和短语聚类成不同的主题,有助于理清文本数据中的主要内容和话题。根据主题聚类数据构建网络舆情共现图,即将不同主题之间的关联关系以图的形式展现出来,可以直观地展示出不同主题之间的关系,帮助用户更好地理解文本数据的结构和内容。对网络舆情共现图数据进行语义相似度计算,即衡量不同主题之间的语义相似程度,有助于识别出在语义上相近或相关的主题。根据网络舆情语义相似度数据进行关联处理,得到网络舆情关联度数据,能够识别出在舆情中具有相似语义的不同主题或内容。
48、可选地,步骤s4具体为:
49、对网络舆情预处理数据进行情感词典扩展,得到网络舆情情感词典扩展数据;
50、对网络舆情情感词典扩展数据进行情感识别,得到网络舆情情感识别数据;
51、对网络舆情情感识别数据进行情感极性标注并情感强度计算,得到网络舆情情感强度数据;
52、根据网络舆情情感强度数据以及网络舆情关联度数据进行情感图构建,得到网络舆情情感图数据;
53、根据网络舆情情感图数据进行情感路径演变处理,得到网络舆情情感数据。
54、本发明中对网络舆情预处理数据进行情感词典的扩展,即将已有的情感词典进行补充和扩展,以覆盖更广泛的情感词汇,有助于提高情感识别的准确性和覆盖范围,使得舆情分析更加全面。对扩展后的情感词典进行情感识别,即在文本中识别出情感词汇,并确定其所属的情感类别,帮助分析人员了解舆情中包含的情感信息。对情感识别结果进行情感极性标注,并计算情感词汇的情感强度,通过情感极性标注,可以确定情感的正负面,而情感强度则反映了情感的程度,有助于更准确地理解文本中表达的情感信息,并进行量化分析。根据网络舆情情感强度数据以及网络舆情关联度数据,构建情感图,即将不同主题或实体之间的情感关联关系以图的形式展现出来,有助于直观地了解不同主题或实体之间的情感关系,帮助用户更好地把握舆情的情感走向。根据情感图数据进行情感路径演变处理,即分析不同主题或实体之间情感的演变过程,帮助分析人员了解舆情中情感的传播路径和演变趋势,为后续的财务危机预警提供更多的情感信息支持。
55、可选地,其中财务危机预警模型包括财务指标体系回归模型以及大数据指标体系回归模型,步骤s5具体为:
56、根据网络舆情情感数据以及网络舆情关联度数据对网络舆情预处理数据进行财务指标体系回归模型构建,得到财务指标体系回归模型;
57、根据网络舆情情感数据以及网络舆情关联度数据对网络舆情预处理数据进行大数据指标体系回归模型构建,得到大数据指标体系回归模型;
58、根据财务指标体系回归模型以及大数据指标体系回归模型进行财务危机预警作业。
59、本发明中通过综合考虑传统财务指标和大数据指标,结合网络舆情数据,构建的模型更具全面性和准确性,能够更好地反映公司的财务状况和风险。利用构建的财务指标体系回归模型和大数据指标体系回归模型,能够实现对公司财务状况的实时监测和预警,及时发现潜在的财务危机风险,有助于公司及时采取应对措施,避免财务危机的发生。通过财务危机预警作业,能够为公司管理层提供及时有效的决策支持,帮助其制定相应的风险管理策略和应对措施,保障公司的财务稳健和健康发展。
60、可选地,本技术还提供了一种基于大数据的上市公司财务危机预警系统,用于执行如上所述的基于大数据的上市公司财务危机预警方法,该基于大数据的上市公司财务危机预警系统包括:
61、网络舆情数据采集模块,用于获取网络舆情数据;
62、网络舆情数据预处理模块,用于对网络舆情数据进行网络舆情数据预处理,得到网络舆情预处理数据;
63、舆情关联度处理模块,用于对网络舆情预处理数据进行舆情关联度处理,得到网络舆情关联度数据;
64、网络舆情情感分析模块,用于根据网络舆情关联度数据对网络舆情预处理数据进行网络舆情情感分析,得到网络舆情情感数据;
65、财务危机预警模型构建模块,用于根据网络舆情情感数据以及网络舆情关联度数据对网络舆情预处理数据进行财务危机预警模型构建,得到财务危机预警模型,以进行财务危机预警作业。
66、本发明的目的在于:通过引入网络舆情数据,使得财务危机预警模型不再局限于传统的财务指标,而是可以考虑外部环境对公司的影响。网络舆情数据可以提供更加多维度的信息,从而增强了预警模型的准确性和全面性。大数据平台的应用使得数据的获取和处理更加高效和实时,相较于传统的财务报表等数据,网络舆情数据的获取更加及时,能够更好地反映公司当前的经营状况,同时,大数据平台也提供了更灵活的数据处理和分析手段,使得预警模型能够根据实时情况进行动态调整和优化。网络舆情关联度数据和网络舆情情感数据的引入,使得预警模型能够更加深入地分析公司财务危机的可能因素。网络舆情关联度数据可以帮助发现与公司财务状况相关的外部因素,而网络舆情情感数据则能够反映市场对公司的情绪和态度,从而更好地识别潜在的风险。基于财务危机预警模型的构建,公司能够及时发现潜在的财务风险,并采取相应的措施进行应对,从而有效降低财务危机发生的概率和影响。预警模型的应用能够提高公司的风险识别和管理效率,保障公司的财务稳健和健康发展。
1.一种基于大数据的上市公司财务危机预警方法,其特征在于,应用于大数据平台,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤s1具体为:
3.根据权利要求2所述的方法,其特征在于,步骤s11具体为:
4.根据权利要求3所述的方法,其特征在于,步骤s112具体为:
5.根据权利要求3所述的方法,其特征在于,步骤s113具体为:
6.根据权利要求2所述的方法,其特征在于,步骤s12具体为:
7.根据权利要求1所述的方法,其特征在于,步骤s3具体为:
8.根据权利要求1所述的方法,其特征在于,步骤s4具体为:
9.根据权利要求1所述的方法,其特征在于,其中财务危机预警模型包括财务指标体系回归模型以及大数据指标体系回归模型,步骤s5具体为:
10.一种基于大数据的上市公司财务危机预警系统,其特征在于,用于执行如权利要求1所述的基于大数据的上市公司财务危机预警方法,该基于大数据的上市公司财务危机预警系统包括: