本发明涉及教育,特别涉及一种基于yolo网络的智慧人脸身份识别方法。
背景技术:
1、劳动教育在中小学教育体系中具有独特且关键的地位,旨在培养学生的实践技能、团队合作精神和社会责任感。然而,在传统教育体系中,劳动教育的评估主要依赖于教师的直接观察和学生的自我报告,这种方法由于其固有的主观判断和非定量化特征,常常导致评估结果与实际情况不一致和不可靠问题,往往无法准确评估学生在劳动教育中的表现和进步。这种评估的不精确性不仅影响了教育质量的提升,也可能导致学生劳动技能和价值观的发展不平衡。故此,制定一种客观、精确并且效率高的劳动教育检测方法对于提升劳动教育的成效和总体质量显得尤为重要。
2、近年来,随着计算机视觉和深度学习技术的发展,智能数据采集和分析技术在教育领域的应用日益增多。特别是基于yolo网络的人脸检测身份识别技术,为劳动教育的评估提供了新的解决方案。与传统方法相比,该技术通过分析视频数据,自动识别和记录学生在劳动教育活动中的参与情况,从而提高评估的客观性和效率,同时减少人力资源的消耗。
3、尽管基于yolo网络的人脸检测技术在静态图像识别方面表现优秀,但在实时视频处理和动态场景识别方面,尤其是在复杂的劳动教育环境中,其准确性和稳定性仍有待提高。此外,这些系统的高效运作通常需要对大量数据进行训练,对数据集的质量和多样性有较高要求。因此,为解决上述技术问题,本发明提出了一种基于yolo网络的智慧人脸身份识别方法。
技术实现思路
1、本发明的目的是提供一种基于yolo网络的智慧人脸身份识别方法,以解决上述现有技术存在的问题。
2、本发明提供的一种基于yolo网络的智慧人脸身份识别方法,包括:
3、获取视频数据,基于所述视频数据获得标注的人脸识别图像数据集;
4、基于yolo v5模型构建yolo智慧人脸身份识别模型,基于所述标注的人脸识别图像数据集对所述yolo智慧人脸身份识别模型进行训练得到训练好的yolo智慧人脸身份识别模型;
5、将待测视频数据输入所述训练好的yolo智慧人脸身份识别模型中进行检测得到目标检测结果。
6、可选地,基于所述视频数据获得标注的人脸识别图像数据集的过程包括:
7、以帧为单位对所述视频数据进行图像截取得到若干人脸图像;
8、基于yolo v5模型对若干所述人脸图像进行识别得到每张图像对应的人脸边界框;
9、基于所述人脸边界框得到对应的初始边界框坐标和人脸置信度分数;
10、对所述人脸边界框对应的初始边界框坐标进行变换得到变换后的边界框坐标;
11、基于labelimg软件对所述人脸图像进行类别识别标注得到标注的人脸识别图像,其中,所述标注的人脸识别图像对应一个标注文件,所述标注文件包括:文件名、人脸置信度分数、类别名称和每个标注目标的变换后的边界框坐标。
12、可选地,对所述人脸边界框对应的初始边界框坐标进行变换得到变换后的边界框坐标的过程包括:
13、基于原始图像尺寸和输入模型后的不同图像尺寸对初始边界框坐标进行标准化处理得到标准化坐标;
14、对所述标准化坐标进行反标准化得到变换后的边界框坐标;
15、其中,所述对初始边界框坐标进行标准化处理的计算公式为:
16、
17、
18、
19、
20、式中,worig表示原始图像的宽度,horig表示原始图像的高度,xmin表示边界框左上角点的x坐标,ymin表示边界框左上角点的y坐标,xmax表示边界框右下角点的x坐标,ymax表示边界框右下角点的y坐标,xnorm表示边界框中心点的x坐标相对于图像宽度的归一化值,ynorm表示边界框中心点的y坐标相对于图像高度的归一化值,wnorm表示边界框的宽度相对于图像宽度的归一化值,hnorm表示边界框的高度相对于图像高度的归一化值。
21、可选地,对所述标准化坐标进行反标准化得到变换后的边界框坐标的计算公式为:
22、
23、
24、
25、
26、可选地,所述yolo智慧人脸身份识别模型包括backbone模块和head模块,基于所述backbone模块和head模块进行人脸识别,得到预测结果的过程包括:
27、基于所述backbone模块对标注的人脸识别图像进行特征提取得到多层特征图;
28、所述head模块基于c3层对所述多层特征图进行融合得到最终输出特征图;
29、对所述最终输出特征图进行预测得到预测结果,其中,所述预测结果包括:特征图预测对象的边界框、类别和置信度。
30、可选地,基于所述预测结果和所述标注文件的真实值构建总损失函数,基于所述总损失函数进行模型优化,其中,所述总损失函数的数学模型为:
31、ltotal=λcioulciou+λfocallfocal+λcross-entropylcross-entropy
32、式中,lciou表示边界框损失函数,lfocal表示背景噪声损失函数,lcross-entropy表示多类别损失函数。
33、可选地,所述yolo智慧人脸身份识别模型还包括基于非极大值抑制对边界框进行过滤的过程。
34、可选地,将待测视频数据输入所述训练好的yolo智慧人脸身份识别模型中进行检测得到目标人物的类别标签和置信度,基于所述目标人物的类别标签和置信度得到目标检测结果;
35、其中,所述类别标签和置信度的计算公式为:
36、类别=arg maxc pclass(c)
37、p=pobj×pclass(c)
38、式中,arg maxc表示用于找到pclass(c)最大化的c的值,pclass(c)表示预测框属于类别c的概率,pobj表示对象存在的置信度,p表示综合置信度。
39、本发明具有如下技术效果:
40、本发明的模型在处理动态场景和复杂背景时展现了更高的准确性和鲁棒性。此外,该模型经过针对劳动教育环境特别优化,能够更有效地处理不同光照条件和多样化的学生行为。该模型不仅提高了评估的准确性,还降低了对大量训练数据的依赖,使得系统在资源有限的教育环境中更易于部署和应用。
1.一种基于yolo网络的智慧人脸身份识别方法,其特征在于,包括以下步骤:
2.根据权利要求1的基于yolo网络的智慧人脸身份识别方法,其特征在于,基于所述视频数据获得标注的人脸识别图像数据集的过程包括:
3.根据权利要求2的基于yolo网络的智慧人脸身份识别智慧识别方法,其特征在于,对所述人脸边界框对应的初始边界框坐标进行变换得到变换后的边界框坐标的过程包括:
4.根据权利要求3的基于yolo网络的智慧人脸身份识别方法,其特征在于,对所述标准化坐标进行反标准化得到变换后的边界框坐标的计算公式为:
5.根据权利要求4的基于yolo网络的智慧人脸身份识别方法,其特征在于,所述yolo智慧人脸身份识别模型包括backbone模块和head模块,基于所述backbone模块和head模块进行人脸识别,得到预测结果的过程包括:
6.根据权利要求5的基于yolo网络的智慧人脸身份识别方法,其特征在于,基于所述预测结果和所述标注文件的真实值构建总损失函数,基于所述总损失函数进行模型优化,其中,所述总损失函数的数学模型为:
7.根据权利要求6的基于yolo网络的智慧人脸身份识别方法,其特征在于,所述yolo智慧人脸身份识别模型还包括基于非极大值抑制对边界框进行过滤的过程。
8.根据权利要求1的基于yolo网络的智慧人脸身份识别方法,其特征在于,将待测视频数据输入所述训练好的yolo智慧人脸身份识别模型中进行检测得到目标人物的类别标签和置信度,基于所述目标人物的类别标签和置信度得到目标检测结果;