本发明属于环境工程,尤其涉及村镇生活源污染未统计量溯源感知。
背景技术:
1、生活源污染是指由人类日常生活和生产活动产生的污染物,主要包括废水、废气、固体废物等。近年来随着全球人口数量增加、城市化率增加、生产力快速发展,生活源污染正在逐渐成为造成城市和村镇环境污染的重要来源。相比于监测设备和管理体系更加完善的城市,村镇往往缺乏对生活源污染负荷量,如生活污水排放量、生活垃圾产生量等实时有效的监测和统计,这使得村镇生活源污染的状况无法被准确掌握。同时由于污染源数据的缺乏,影响了针对村镇生活污染源负荷的准确预测。因此有必要开发一种全新的针对分析城镇生活源污染的分析预测方法,实现对村镇生活源污染未统计量的精确溯源感知。
技术实现思路
1、本发明是为了解决村镇生活源污染负荷在缺乏统计数据的情况下,无法被准确预测的问题,现提供基于迁移学习的村镇生活源污染未统计量溯源感知方法。
2、基于迁移学习的村镇生活源污染未统计量溯源感知方法,包括:
3、构建考虑了生活垃圾产量影响因素的研究区域生活垃圾产量指标预测数据库,所述研究区域生活垃圾产量指标预测数据库包括能够表征研究区域生活垃圾产量的卫星遥感图像、政府统计年鉴数据、研究机构统计数据、新闻报道数据和政府文件数据;
4、在所述研究区域生活垃圾产量指标预测数据库中提取数据特征和图像特征,并运用ml-lstm方法获得多指标跨模态融合特征;
5、将所述多指标跨模态融合特征作为输入,将与所述多指标跨模态融合特征对应的生活垃圾产量作为输出,构建城市垃圾产量预测模型;
6、提取所述城市垃圾产量预测模型参数的特征,并计算各特征的shap值,对各特征的shap值的绝对值由大至小进行排序,选取绝对值排名前五的特征作为所述城市垃圾产量预测模的关键特征;
7、冻结城市垃圾产量预测模型的卷积层,并对低城市垃圾产量预测模型的参数进行调整,使得r2>0.8,获得村镇垃圾产量预测模型,其中,r2为城市垃圾产量预测模型的拟合优度;
8、对研究区域进行空间网格划分,使得研究区域生活垃圾产量指标预测数据库被划分为多个空间网格特征集,基于随机森林算法将各空间网格特征集中的数据与所述村镇垃圾产量预测模型进行回归关系拟合,获得各空间网格中数据与生活垃圾产量的映射关系,根据该映射关系获得研究区域内各村镇生活垃圾产量。
9、进一步的,上述生活垃圾产量影响因素包括研究区域的人口分布数据、研究区域面积、土地利用类型、地表高程数据、道路里程数、等级公路里程数、公共交通里程数、交通路网数据、生活用水量、用电量、夜间灯光数据、人均可支配收入和gdp。
10、进一步的,运用平权统计法对所述研究区域生活垃圾产量指标预测数据库中的数据进行特征提取,获得数据特征;运用纹理分析、形状分析或边缘检测法对所述研究区域生活垃圾产量指标预测数据库中的卫星遥感图像进行特征提取,获得图像特征。
11、进一步的,上述运用ml-lstm方法获得多指标跨模态融合特征,包括:
12、运用ml-lstm方法,将所述数据特征输入第一层lstm,获得第一隐藏层状态;
13、将图像特征与所述第一隐藏层状态输入第二层lstm,获得第二隐藏层状态;
14、将数据特征与所述第二隐藏层状态输入第三层lstm,获得多指标跨模态融合特征。
15、进一步的,上述构建城市垃圾产量预测模型包括:
16、将所述多指标跨模态融合特征作为输入,将与所述多指标跨模态融合特征对应的生活垃圾产量作为输出,对lightgbm基础模型进行训练,并使用误差指标mse、mae和mape评估训练效果,获得基础模型;
17、使用两两组合的网格搜索方法,以5折交叉检验对模型核心超参数n_estimators、max_depth、learning rate、min_child_weight、subsample、colsample_bytree和random_state进行调优,并使用误差指标mse、mae和mape评估参数调优效果,获得最优参数组合,进而获得城市垃圾产量预测模型。
18、进一步的,使用解释器shap.treeexplainer计算各特征的shap值。
19、进一步的,使用keras冻结城市垃圾产量预测模型的卷积层。
20、进一步的,建立100m*100m的空间渔网,对研究区域进行空间网格划分。
21、进一步的,将研究区域内各村镇生活垃圾产量超出阈值的村镇认定为高生活垃圾产生风险的村镇。
22、进一步的,上述阈值为0.75kg/人*天。
23、本发明的优势在于:
24、本发明首度利用多指标跨模态融合模型,将图像特征、文本特征和数据特征有效融合,形成跨模态融合特征指标体系。基于迁移学习框架,将城市生活垃圾产量预测模型迁移至村镇生活垃圾产量预测,实现了在缺乏统计数据的情况是对村镇生活垃圾产量的精确预测。本发明中迁移学习的应用提供了全新的村镇生活源污染负荷量的分析预测方法,在村镇生活源污染智能管理领域都有广大的应用前景。
1.基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,包括:
2.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,所述生活垃圾产量影响因素包括研究区域的人口分布数据、研究区域面积、土地利用类型、地表高程数据、道路里程数、等级公路里程数、公共交通里程数、交通路网数据、生活用水量、用电量、夜间灯光数据、人均可支配收入和gdp。
3.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,
4.根据权利要求1或3所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,所述运用ml-lstm方法获得多指标跨模态融合特征,包括:
5.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,所述构建城市垃圾产量预测模型包括:
6.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,使用解释器shap.treeexplainer计算各特征的shap值。
7.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,使用keras冻结城市垃圾产量预测模型的卷积层。
8.根据权利要求1所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,建立100m*100m的空间渔网,对研究区域进行空间网格划分。
9.根据权利要求1、2、3、5、6、7或8所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,将研究区域内各村镇生活垃圾产量超出阈值的村镇认定为高生活垃圾产生风险的村镇。
10.根据权利要求9所述的基于迁移学习的村镇生活源污染未统计量溯源感知方法,其特征在于,所述阈值为0.75kg/人*天。