基于卷积神经网络的视觉导航方法、装置、设备和介质与流程

专利检索2025-06-23  6


本发明涉及视觉导航,尤其涉及基于卷积神经网络的视觉导航方法、装置、设备和介质。


背景技术:

1、视觉导航主要用于目标检测和目标定位中。近几年随着科技的发展,视觉导航计算也有广泛的运用。视觉导航主要是能通过模拟人的视觉来定位出物体的位置,使其可以不受外界环境的干扰,克服了gps受到电磁信号等干扰时导致的无法精确定位。

2、随着无人机技术的不断发展,无人机在各行各业都产生了重大影响。但目前无人机极度依赖gps进行定位,路径的规划、修正,自身的姿态修正等都完全依靠gps,在肉眼不可见的情况下,无人机gps受到干扰或通讯断开,无人机面临的基本就是目标丢失、任务失败,甚至坠毁。基于该情况,国内外都在思考如何实现一种方法让无人机能够不依赖gps,甚至不依赖外界通信进行导航,惯性导航、视觉导航等由此而生。但惯性导航存在不可消除的累积误差,传统的视觉导航存在错误率较高、计算速度慢等问题。得益于近年来硬件算力的升级,在嵌入式设备中使用神经网络成为了可能。

3、视觉导航是飞行器自主导航的一种方法,作为一种新兴技术,准确度和计算速度还有待提高。尤其是在无人机的实际应用中,输出任何错误的导航输出都可能导致严重的后果,所以如何提升视觉导航的算法性能,降低视觉导航的错误率,是一个亟待解决的问题。


技术实现思路

1、有鉴于此,本发明的目的是提供基于卷积神经网络的视觉导航方法、装置、设备和介质,用于提升视觉导航的算法性能,极大降低视觉导航的错误率,促进智能自主导航效果。

2、本发明通过以下技术手段解决上述技术问题:

3、第一方面,本发明提供了一种基于卷积神经网络的视觉导航方法,包括以下步骤:

4、构建卷积神经网络训练需要的图像训练集和验证集;

5、构建和训练并验证卷积神经网络模型;

6、获取飞行器当前摄像头所拍摄的飞行图像;

7、将当前飞行图像进行前处理后,输入验证后的卷积神经网络模型中,得到输出层结果,解析输出层结果,得到跑道在图像中的位置;

8、将跑道在图像中的位置送入导航算法,得到跑道相对于飞行器的角度偏航信息,在成功检测到跑道目标时,会将获取的飞行图像和图像中跑道的位置信息送入目标跟踪器,生成或更新目标跟踪器,在后续未检测到跑道或结果还未更新时,可使用目标跟踪器预测跑道位置,以保持跑道位置的连续性。

9、通过上述技术方案,在飞行器的视觉导航上使用了特化的卷积神经网络,加强了对陌生同类目标的泛化能力,极大地提高了检测的速度和正确率,使其可以在二十毫秒的时间内对一张输入的图片进行检测处理,判断该图像是否有目标,若有则找出目标的位置,并使目标的正确率可以保持在96%以上。同时跟踪器的实现满足了飞行器控制时的连续性,排除了数据不连贯导致飞行器修正姿态不及时的问题,实现了从相机到飞行器的整套视觉导航算法,通过飞行器自身的视觉传感器即可自主飞行。

10、结合第一方面,在一些可选的实施方式中,所述构建卷积神经网络训练需要的图像训练集和验证集,包括:

11、获取飞行器在飞行时利用视觉传感器拍摄的跑道视频;

12、按照规定的时间间隔对跑道视频进行处理,得到训练样本;

13、清理训练样本中不清楚的和没有跑道的图片,并任意抽取图片总量的百分之十作为验证集,剩下的图片与通用样本为图像训练集。

14、结合第一方面,在一些可选的实施方式中,所述构建和训练并验证卷积神经网络模型,包括:

15、基于跑道特性修改神经网络,设计并构建卷积神经网络的各层结构;

16、将图像训练集输入构建的卷积神经网络模型中,不断修正权重,训练得到最终的卷积神经网络模型;

17、将验证集的图像输入最终的卷积神经网络模型中,验证正确率。

18、结合第一方面,在一些可选的实施方式中,所述卷积神经网络模型的各种层包括:

19、输入层,用于获取输入图片并对图片进行预处理;

20、卷积层,用于提取特征,所述特征包括边缘、纹理、角点和颜色;

21、激活函数,用于将线性输入分散开转化为非线性的值;

22、池化层,用于减小特征图片的空间维度;

23、全连接层,用于将多维特征向量转换为一维;

24、损失函数,用于评判计算得出的结果与标准正确结果的差异;

25、输出层,用于输出预测结果。

26、结合第一方面,在一些可选的实施方式中,所述将当前飞行图像进行前处理后,输入验证后的卷积神经网络模型中,得到输出层结果,包括:

27、识别当前飞行图像的尺寸和格式;

28、判断当前飞行图像的尺寸和格式是否满足卷积神经网络模型的输入要求;

29、修改当前飞行图像的尺寸和格式以满足卷积神经网络模型的输入要求,得到前处理后的飞行图像;

30、将前处理后的飞行图像输入训练后的卷积神经网络模型中,得到输出层结果。

31、结合第一方面,在一些可选的实施方式中,所述解析输出层结果,得到跑道在图像中的位置,包括:

32、解析输出层得到的矩形框、置信度和所有分类id;

33、比较获取置信度最高的跑道矩形框,并根据跑道矩形框应该包含子目标的原则进行目标分类和分组,根据设置的导航策略选取对应的目标进行导航;

34、将目标矩形框的坐标还原为原始的飞行图像中的坐标,得到原始的飞行图像中的目标位置信息。

35、结合第一方面,在一些可选的实施方式中,所述将跑道在图像中的位置送入导航算法,得到跑道相对于飞行器的角度偏航信息,包括:

36、实现基于图像像素的导航算法;

37、计算跑道相对于飞机器在俯仰角、滚转角和偏航角上的偏移,修正导航信息。

38、结合第一方面,在一些可选的实施方式中,所述在成功检测到跑道目标时,会将获取的飞行图像和图像中跑道的位置信息送入目标跟踪器,生成或更新目标跟踪器,在后续未检测到跑道或结果还未更新时,可使用目标跟踪器预测跑道位置,以保持跑道位置的连续性,包括:

39、设计并实现目标跟踪器;

40、在有目标位置时对目标位置进行更新以维护目标跟踪器的正确性与实时性;

41、在没有目标位置时预测目标位置,保持目标位置的连续性。

42、第二方面,本发明提供了一种基于卷积神经网络的视觉导航装置,包括:

43、样本采集模块,用于构建卷积神经网络训练需要的图像训练集和验证集;

44、模型生成模块,用于构建和训练并验证卷积神经网络模型;

45、图像获取模块,用于获取飞行器当前摄像头所拍摄的飞行图像;

46、结果输出模块,用于将当前飞行图像进行前处理后,输入验证后的卷积神经网络模型中,得到输出层结果,解析输出层结果,得到跑道在图像中的位置;

47、导航算法模块,将跑道在图像中的位置送入导航算法,得到跑道相对于飞行器的角度偏航信息,在成功检测到跑道目标时,会将获取的飞行图像和图像中跑道的位置信息送入目标跟踪器,生成或更新目标跟踪器,在后续未检测到跑道或结果还未更新时,可使用目标跟踪器预测跑道位置,以保持跑道位置的连续性。

48、第三方面,本发明提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现上述的基于卷积神经网络的视觉导航方法。

49、第四方面,本发明提供了一种计算机可读存储介质,所述可读存储介质中包含有至少一段计算机程序,所述至少一段计算机程序被设置为运行时执行以实现上述的基于卷积神经网络的视觉导航方法。

50、可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面的相关描述,在此不在赘述。


技术特征:

1.基于卷积神经网络的视觉导航方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于卷积神经网络的视觉导航方法,其特征在于,所述构建卷积神经网络训练需要的图像训练集和验证集,包括:

3.根据权利要求2所述的基于卷积神经网络的视觉导航方法,其特征在于,所述构建和训练并验证卷积神经网络模型,包括:

4.根据权利要求3所述的基于卷积神经网络的视觉导航方法,其特征在于,所述卷积神经网络的层包括:

5.根据权利要求1所述的基于卷积神经网络的视觉导航方法,其特征在于,所述将当前飞行图像进行前处理后,输入验证后的卷积神经网络模型中,得到输出层结果,包括:

6.根据权利要求5所述的基于卷积神经网络的视觉导航方法,其特征在于,所述解析输出层结果,得到跑道在图像中的位置,包括:

7.根据权利要求6所述的基于卷积神经网络的视觉导航方法,其特征在于,所述将跑道在图像中的位置送入导航算法,得到跑道相对于飞行器的角度偏航信息,包括:

8.基于卷积神经网络的视觉导航装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1-7任一项所述的基于卷积神经网络的视觉导航方法。

10.一种计算机可读存储介质,其特征在于,所述可读存储介质中包含有至少一段计算机程序,所述至少一段计算机程序被设置为运行时执行以实现如权利要求1-7任一项所述的基于卷积神经网络的视觉导航方法。


技术总结
本发明涉及视觉导航技术领域,公开了基于卷积神经网络的视觉导航方法、装置、设备和介质。视觉导航方法首先构建训练集和验证集,分别用于训练和验证卷积神经网络模型,同时优化卷积神经网络,得到最终的卷积神经网络模型的正确率较高,泛化能力强,能够更准确的得到检测结果;因当前飞行图像传入卷积神经网络模型时图像尺寸发生了改变,因此需要将输出层结果中的坐标还原为原始图像中的坐标得到原始图像中的跑道信息位置,再根据原始图像中的坐标生成目标跟踪器跟踪跑道,以便在没有检测到跑道时进行视觉导航。本发明对卷积神经网络进行优化,有效提高了模型的正确率和泛化能力,实现了全面有效的视觉导航算法,进而实现了智能自主导航的效果。

技术研发人员:王兰春,袁菱江,李建文,方保平,叶强
受保护的技术使用者:成都九天智飞科技有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1155578.html

最新回复(0)