1.本发明涉及机器协同控制的技术领域,具体地,涉及防疫机器群复杂多环境下智能协同作业方法和系统。
背景技术:
2.在工作环境中运动的防疫机器可以看成一个具有多个运动状态的系统,时序逻辑的表达力很强,适用于大量防疫机器人的控制,将ltl理论与人工智能、控制理论、模型检测等方法相结合,通过机器人的实时感知、探测和与环境的交互,可以为弱化信息和冲突消解等多约束限制下的机器人智能协同难题提供有效可行的新思路。
技术实现要素:
3.针对现有技术中的缺陷,本发明的目的是提供一种防疫机器群复杂多环境下智能协同作业方法和系统。
4.根据本发明提供的一种防疫机器群复杂多环境下智能协同作业方法,所述方法包括如下步骤:
5.步骤1:在动态环境下进行多机器人任务和角色的动态编配;
6.步骤2:根据动态编配结果构建基于ltl的弱化信息条件下的智能协同策略;
7.步骤3:根据动态编配结果构建基于ltl的冲突消解条件下的智能协同策略。
8.优选地,所述步骤1包括:
9.步骤1.1:使用强化学习,通过机器人与环境的交互,学习最优策略以最大化回报或实现特定目标的问题;
10.步骤1.2:使用博弈论,实现任务选择间的动态平衡;
11.步骤1.3:将强化学习和博弈论结合,实现动态未知的非结构环境下的任务智能分配。
12.优选地,所述步骤1还包括将机器人角色为划分为领导者和执行者,构建领导者
‑
执行者的层级组织,划分的标准是通过最少量的领导者机器人来驱使和控制大数量的执行者机器人。
13.优选地,所述步骤2包括构建网络化系统的机器人信息拓扑,基于构建的信息拓扑,利用单纯复形模型刻画系统中多维的相互作用,提取拓扑特征,融合优化控制、非线性控制、随机控制等方法,设计多机器人协同控制策略。
14.优选地,所述步骤3包括基于构建的迁移系统、ltl任务自动机和笛卡尔乘积构成的任务可行网络拓扑乘积自动机;应用模型检验技术、人工智能和决策与控制等方法,搜寻满足系统规约的路径。
15.优选地,所述步骤3包括构建基于概率模型的多机器人的智能协同与运动规划的新方法,在概率迁移系统和ltl生成的不确定自动机基础上,构造一个自动机。
16.本发明还提供一种防疫机器群复杂多环境下智能协同作业系统,所述系统包括如
下模块:
17.模块m1:在动态环境下进行多机器人任务和角色的动态编配;
18.模块m2:根据动态编配结果构建基于ltl的弱化信息条件下的智能协同策略;
19.模块m3:根据动态编配结果构建基于ltl的冲突消解条件下的智能协同策略。
20.优选地,所述模块m1包括:
21.模块m1.1:使用强化学习,通过机器人与环境的交互,学习最优策略以最大化回报或实现特定目标的问题;
22.模块m1.2:使用博弈论,实现任务选择间的动态平衡;
23.模块m1.3:将强化学习和博弈论结合,实现动态未知的非结构环境下的任务智能分配。
24.优选地,所述模块m1还包括将机器人角色为划分为领导者和执行者,构建领导者
‑
执行者的层级组织,划分的标准是通过最少量的领导者机器人来驱使和控制大数量的执行者机器人。
25.优选地,所述模块m2包括构建网络化系统的机器人信息拓扑,基于构建的信息拓扑,利用单纯复形模型刻画系统中多维的相互作用,提取拓扑特征,融合优化控制、非线性控制、随机控制等方法,设计多机器人协同控制策略。
26.与现有技术相比,本发明具有如下的有益效果:
27.1、ltl能够表达丰富且复杂的任务规范,且接近人类自然语言的描述,使得机器复杂任务的描述更为直接和便捷,增强了系统的可用性和易用性;
28.2、作为一种自动化系统验证方法,模型检测(model
‑
checking)方法具有correct
‑
by
‑
design特性,确保了协同规划能满足环境、系统、任务等多种复杂规约(即确保协同规划的正确性);
29.3、作为一种多机器人协同规划控制的理论框架,它具有良好的开放性和扩展性,方便结合现有控制方法和人工智能领域最新的科研成果。
附图说明
30.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
31.图1是多机器人协同控制的总体技术方案图;
32.图2是基于ltl智能规划控制理论的框架示意图;
具体实施方式
33.下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
34.参照图1和图2,针对隔离区承担物资配送的防疫机器人,使用强化学习,通过机器人与社区环境的交互,学习最优策略以最大化回报或实现特定目标的问题;使用博弈论,实现配送任务选择间的动态平衡;将强化学习和博弈论结合,实现动态未知的非结构环境下
的任务智能分配。将机器人角色为划分为领导者和执行者,构建领导者
‑
执行者的层级组织,划分的标准是通过最少量的领导者机器人来驱使和控制大数量的执行者机器人。
35.针对动态不确定非结构环境及复杂任务场景,考虑到机器人的行为和运动会受到外界因素的影响,将机器人行为和运动看作一个不确定事件,提取环境中的影响因素,基于马尔可夫决策过程模型构建迁移系统,通过概率模型来刻画机器人受环境中动态因素、机器人硬件不确定因素、以及信息交互等因素影响下的行为特征。
36.ltl是由一组原子命题集、逻辑运算符和时序操作符组成。ltl作为一种形式化语言,与人们正常的语言习惯相近,将机器人需要完成的任务编码为线性时序公式,不仅可以描述点到点的简单任务,也可以描述较为复杂的任务。该课题将采用ltl来描述机器人复杂多样的指定任何和需求行为,并根据ltl种类转换为相对应的图表形式的自动机。
37.根据隔离区的地理环境特点将配送,将隔离区看作一个具有有限状态的加权切换系统用线性时序逻辑语言描述智防疫机器人需要执行的任务。构建融合系统和任务的product自动机。使用dijkstra算法获取最优路径并反馈给实际系统,从而得到防疫机器人在实际环境中的路线。
38.多机器人系统中,每个独立的机器人都是网络化系统中的一个节点,通过信息的实时传递与共享来实现协同合作。其通信网络的拓扑结构特征确定了其个体间信息交流和共享的方式,也决定了智能体系统是否可以协同完成复杂的任务。针对动态非结构环境和复杂任务场景下,构建随机网络,切换网络,时变网络等来刻画机器人间信息交流受限、时滞、丢包等情况。
39.基于数图理论和控制理论,运用持续同调来提取网络的拓扑特征,挖掘多机器人系统的信息拓扑与多级机器的信息交互和协同作业之间的是内在规律,为弱化信息限制下的协同作业提供理论支撑。
40.基于单纯复形分析方法所提取出来的拓扑特征,融合优化控制、非线性控制、随机控制等方法,设计多机器人协同控制策略,使得机器人能利用局部的和有限的信息交互来进行有效的智能协同,实现弱化信息限制下的智能协同与作业。
41.基于构建的迁移系统、ltl任务自动机,和笛卡尔乘积构成的任务可行网络拓扑乘积自动机;应用模型检验技术、人工智能、和决策与控制等方法,搜寻满足系统规约的最优路径;
42.构建基于概率模型的多机器人的智能协同与运动规划的新方法,在概率迁移系统和ltl生成的不确定b
ü
chi自动机基础上,构造一个松弛的product自动机,使机器人不必严格遵循期望的ltl约束,结合强化学习和博弈论等理论,根据实时感知到的环境信息,在有限的时域内找寻最优的消解冲突的运动规划。
43.本发明还提供一种防疫机器群复杂多环境下智能协同作业系统,包括:模块m1:在动态环境下进行多机器人任务和角色的动态编配;模块m1包括:模块m1.1:使用强化学习,通过机器人与环境的交互,学习最优策略以最大化回报或实现特定目标的问题;模块m1.2:使用博弈论,实现任务选择间的动态平衡;模块m1.3:将强化学习和博弈论结合,实现动态未知的非结构环境下的任务智能分配;模块m1还包括将机器人角色为划分为领导者和执行者,构建领导者
‑
执行者的层级组织,划分的标准是通过最少量的领导者机器人来驱使和控制大数量的执行者机器人。
44.模块m2:根据动态编配结果构建基于ltl的弱化信息条件下的智能协同策略;模块m2包括构建网络化系统的机器人信息拓扑,基于构建的信息拓扑,利用单纯复形模型刻画系统中多维的相互作用,提取拓扑特征,融合优化控制、非线性控制、随机控制等方法,设计多机器人协同控制策略。
45.模块m3:根据动态编配结果构建基于ltl的冲突消解条件下的智能协同策略。
46.本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
47.以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本技术的实施例和实施例中的特征可以任意相互组合。
转载请注明原文地址:https://win.8miu.com/read-50442.html