多智能体系统的协同群集运动控制

￥94.80

运费：	¥ 0.00-18.00

立即购买

支付：: 微信支付银行卡支付宝

商品详情

书名：多智能体系统的协同群集运动控制
定价：120.0
ISBN：9787030511652
作者：陈杰，方浩，辛斌
版次：1
出版时间：2017-10

内容提要：
本书以多智能体系统协同群集运动控制为主线，首先介绍图论和控制器设计所用到的基础理论知识；其次，分别从拓扑结构的边保持和代数连通度两个角度介绍了连通性保持条件下的协同群集运动控制协议设计方法。进而，从个体动态模型和拓扑结构模型两方面继续深入，针对典型的轮式移动机器人非完整约束模型介绍了连通性保持条件下的协同控制策略，为简化系统复杂拓扑结构对控制器设计的影响，还介绍了基于骨干网络提取的协同群集运动控制策略。本书将个体动态模型由一阶、二阶线性模型提升到高阶非线性系统模型，介绍了高阶非线性系统协同控制协议设计方法；*后，针对多智能体系统非合作行为检测与隔离进行了详细介绍，并提出了相关算法。

目录：
目录
编者的话
序言
前言
第1章绪论 1
1.1 多智能体分布式群集运动控制 1
1.2 多智能体一致性控制概述 5
1.2.1 低阶积分器多智能体一致性 6
1.2.2 高阶线性多智能体一致性 11
1.2.3 高阶非线性多智能体一致性 17
1.3 多智能体非合作行为检测与补偿概述 21
1.4 代数图论背景知识 26
第2章连通性保持条件下多智能体系统群集运动控制 31
2.1 研究背景 31
2.2 问题描述 31
2.3 领航跟随群集运动控制律 32
2.4 稳定性分析 34
2.5 仿真和实验 37
2.5.1 数值仿真 37
2.5.2 实物实验 40
2.6 结论 43
第3章基于代数连通度估计的多智能体系统群集运动控制 44
3.1 研究背景 44
3.2 问题描述 44
3.3 控制律设计 46
3.4.2 的分布式估计 47
3.5 稳定性分析 52
3.6 仿真和实验 55
3.6.1 数值仿真 55
3.6.2 实物实验 58
3.7 结论 60
第4章连通性保持下多移动机器人群集控制 62
4.1 研究背景 62
4.2 问题描述 62
4.3 群集运动控制器设计 63
4.3.1 不带有领航者的群集运动控制 63
4.3.2 带有领航者的群集运动控制 67
4.4 仿真和实验 70
4.4.1 数值仿真 70
4.4.2 实物实验 72
4.5 结论 77
第5章基于骨干网络的多智能体系统群集运动与避障控制 78
5.1 研究背景 78
5.2 预备知识 78
5.2.1 问题描述 78
5.2.2 流体力学基础 79
5.2.3 流函数 79
5.3 总体控制策略 81
5.3.1 分布式拓扑控制 82
5.3.2 分布式运动控制 86
5.4 仿真和实验 93
5.4.1 数值仿真 93
5.4.2 实物实验 98
5.5 结论　99
第6章参数不确定的高阶非线性多智能体系统一致性控制 101
6.1 研究背景 101
6.2 问题描述 101
6.3 分布式控制器设计 102
6.3.1 基于邻居信息的虚拟控制 102
6.3.2 控制器设计过程 102
6.4 数值仿真 108
6.5 结论 112
第7章 Brunovsky型高阶非线性多智能体系统一致性控制 114
7.1 研究背景 114
7.2 问题描述 114
7.3 分布式控制器设计 116
7.3.1 基于邻居信息的分布式虚拟控制器设计 116
7.3.2 基于邻居信息的模糊逻辑系统 116
7.3.3 控制器迭代设计过程 117
7.4 数值仿真 124
7.5 结论 128
第8章高阶非线性多智能体分布式自适应鲁棒控制 129
8.1 研究背景 129
8.2 问题描述 129
8.3 自适应鲁棒一致性控制 130
8.4 主要结论和系统稳定性分析 133
8.5 自适应鲁棒一致性控制器性能分析 135
8.6 数值仿真 135
8.7 结论 138
第9章多任务约束下多智能体协同编队控制 139
9.1 研究背景 139
9.2 问题描述 139
9.3 多任务约束协调与求解 140
9.4 多任务切换与编队控制器设计 141
9.5 系统稳定性分析 145
9.6 仿真和实验 149
9.6.1 数值仿真 149
9.6.2 实物实验 151
9.7 结论 152
第10章一阶多智能体系统非合作行为检测与隔离 154
10.1 研究背景　154
10.2 系统模型及非合作行为建模 154
10.2.1 系统建模 154
10.2.2 非合作行为定义 155
10.2.3 非合作行为建模 156
10.3 一阶多智能体系统非合作行为检测、隔离与修复 157
10.3.1 问题描述 157
10.3.2 非合作行为检测、隔离与修复算法设计 159
10.3.3 仿真和实验 167
10.4 结论 173
第11章基于邻居相关状态的多智能体非合作行为检测与隔离 174
11.1 研究背景 174
11.2 基于邻居相关状态的非合作行为检测 174
11.2.1 问题描述 174
11.2.2 非合作行为检测模型的构建 176
11.2.3 非合作行为检测算法的设计 182
11.2.4 数值仿真 186
11.3 非合作行为检测信息的交互与融合 191
11.3.1 问题描述 191
11.3.2 检测信息的交互与融合方案 191
11.3.3 数值仿真 196
11.4 结论 197
参考文献 199

在线试读：
第1章绪论
　　1.1 多智能体分布式群集运动控制
　　智能体一般是指一个物理的或抽象的实体，它能感知到自己所处的环境，并能正确调用自身所具有的知识，对环境做出适当的反应。多智能体系统并没有一个严格的定义，通常是指由多个智能体及其相应的组织规则和信息交互协议构成的，能够完成特定任务的一类复杂系统。其中，组织规则决定智能体之间的连接关系，信息交互协议用于确定及更新智能体的状态。在现实世界中存在大量多智能体系统的实例，例如，鱼群自发地聚集洄游，多只蚂蚁协作搬运食物，牛群有组织地迁徙，鸟群成群结队地飞行等 (图1.1)，这类系统往往包含数量庞大的个体，但个体本身的智能程度却极为有限。在群体的行进过程中，并没有哪个个体能够对剩余个体进行全局的控制，信息的获取与交换也局限在有限的范围内，而正是这种简单的运行方式，却创造出了纷繁复杂的群体行为。
　　图1.1 自然界中多智能体系统实例
　　受此类自然现象启发，学者提出了人工多智能体系统的概念，并从拓扑学及控制理论等角度对其进行了深入的研究。现阶段人工多智能体系统及其相关理论已经被应用在诸多领域，如无人机编队飞行、无人地面车辆自主行进与协作、电网系统的智能控制与调度等。未来，随着无人设备的不断推广及生产过程中自动化水平的不断提高，传统的面向单一对象的控制理论将很难满足实际的控制需求，而多智能体系统因其功能强大、结构灵活、可扩展性强等特点必将得到越来越广泛的应用。
　　近年来，群集运动控制作为多智能体系统分布式协同控制中的典型问题受到了各领域研究人员的广泛关注。群集运动具有适应性、鲁棒性、分散性和自组织性等特点，使其有着极其重要的实际应用，如无人驾驶飞机编队、地面机器人集群作战和水下机器人地形探测等。网络化多智能体系统的分布式群集运动控制的相关理论可以为编队控制、区域覆盖和探索、战场监视和侦察等空间分布式协作任务提供解决方案[1-5]。1987 年，Reynolds 首先提出了Boids 模型，该模型由分离性、聚集性和速度校准三个启发式准则构成[6]。受到上述模型的启发，Tanner 和Olfati-Saber 等提出了一类基于速度一致性结合人工势场函数的群集运动控制算法[3, 4]。特别针对具有切换拓扑结构的系统，采用集值映射和非光滑李雅普诺夫稳定性理论对系统的收敛性进行了分析[3]。文献 [7] 对多智能体系统不施加任何连通性假设的随机框架进行了理论分析，证明了智能体在交互半径及速度不变的情况下，且群体数量足够大时系统的收敛性。文献 [8] 利用测地线控制的方法*小化势能函数来实现群集控制。其中所有智能体在一个圆周或者球面上运动，其速度大小保持不变，通过设计相应的控制规则来调整速度的方向以使所有智能体的速度矢量渐近趋同，并且使智能体之间的相对位置偏差保持不变。此外，诸如避障、到达等很多附加规则也被融入原始的群集运动算法中[4, 9, 10]。特别地，Olfati-Saber等提出了带有虚拟领航者的分布式群集运动控制的一般性理论框架[4, 9]，其中β和γ智能体被引入系统中，从而可有效实现智能体对障碍物的规避和虚拟领航者的精确跟踪。
　　正如文献 [3] 和 [4] 所述，上述群集控制策略严格依赖于网络拓扑在演化过程中的连通性。然而，在实际应用中只能保证网络的初始连通性，并不能保证网络在动态切换过程中的连通性。因此，为了避免网络拓扑在系统演化过程中发生分割从而导致任务执行失败的现象发生，应重点研究面向具体控制任务的带有连通性保持功能的系统分布式群集运动控制策略，这对于确保大规模分布式多智能体系统群集运动控制的稳定性具有非常重要的理论意义和现实意义。
　　为此，国内外学者针对多智能体系统群集运动中的连通性保持问题开展了深入研究，研究成果大体上可以分为局部连通性保持方法和全局连通性保持方法两大类。其中局部连通性保持方法是指在网络拓扑初始连通的条件下，使网络中所有的初始通信连接都能够得到保持。其基本思想为利用通信拓扑的连通性依赖于智能体的空间位置分布的性质，考虑通过引入势场力的作用来控制个体的间距以实现网络的连通性控制，通过吸引力和排斥力的综合叠加使系统在收敛到期望的目标构形的同时实现网络的通信连通性保持。该方法的本质为通过赋予邻接智能体之间拓扑连接一定的非线性权重 (张力作用), 使其相对距离达到通信半径时张力为无穷大来实现连通性保持。这类方法的优点为可以对连通性的保持给出严格的理论证明。然而，实际上智能体之间的相对位置在运动过程中可能会发生变化，从而导致总体拓扑结构的动态切换和重组，以适应环境和任务的动态变化而具有灵活变形的能力。若要求保持网络中所有的初始拓扑连接，将会使智能体之间的运动约束过于严格，因而大大局限了算法的应用性和推广性。而网络拓扑的全局性控制方法可以较好地克服上述方法的缺陷，众所周知，网络拓扑图对应的拉普拉斯(Laplacian) 矩阵的第二小特征值 .2 (代数连通度) 直接反映了整个网络的连通程度和一致性控制算法的收敛速度。因此，可考虑从代数图论的相关理论出发，通过控制群体通信拓扑所对应的拉普拉斯矩阵的代数连通度的方法来优化系统的通信拓扑，即基于拉普拉斯矩阵的谱特征并运用分布式优化与控制的方法使网络的代数连通度恒为正来保证网络的连通性。这类方法的优点为不对网络中的任何拓扑连接施加约束，可实现任意连通网络拓扑之间的切换。其中具有代表性的方法有几何约束法与谱图理论法。几何约束法首先由 Spanos 和 Murray 提出[11], 该方法此后被 Savla 等推广至二阶系统[12]。通过保持网络化多机器人系统的局部几何连通鲁棒性, 可以实现网络的全局连通性保持。对于谱图理论法, 相应的控制方法又可以进一步划分为两个分支。一类为通过次梯度优化和半正定规划 (SDP) 等集中式和分布式优化方法来实现网络的代数连通度 (algebraic connectivity) 的*大化，进而实现网络的全局连通性保持与优化[13]。另一类为采用分布式特征值/特征向量估计方法与分布式平均值估计方法相结合来使网络的代数连通度恒为正，从而实现连通性保持[14, 15]。国内方面，对于多智能体拓扑的全局连通性控制的研究还刚刚起步，其中具有代表性的工作为席裕庚和李晓丽等针对双积分器系统，通过将改进分布式幂迭代特征值估计算法与全局连通性保持势场函数相结合，有效地实现了网络全局连通性保持条件下系统的分布式群集运动控制[16]。
　　据作者所知，上述控制方法存在的共同缺陷为控制律中所采用的人工势函数为无界函数，其实现连通性控制的基本思想为：当初始邻接的智能体之间的距离等于邻接距离 (通信半径) 时，无界势函数的梯度为无穷大，从而产生无穷大的吸引力，使得相应的通信连接不会脱离彼此的通信范围，从而实现连通性保持。上述连通性保持的思想本质上是基于势函数梯度在通信半径处的无界性来保证的，其在理论上无法保证网络的连通性在有限的势场力作用下能够得到保持，当然也无法获得可以使网络连通性能够得到保持的势场力的上界。然而，在实际应用中，智能体本身携带的执行器仅具有有限执行能力，如移动机器人或机械手的驱动电机无法产生无穷大的力矩，因而导致所得到的无界控制器具有本质局限性。一方面，尽管在文献 [17].[20] 中，有关作者设计出有界势函数用以产生有界的控制输入，但是其理论结果仅对一阶积分器模型有效。不仅如此，控制器的设计是基于系统中不会出现多于一对的智能体发生碰撞，而且也不会出现同一个智能体同时和其他智能体发生碰撞和丧失连通性等相对保守的基本假设条件。另一方面，在现有的关于带有动态领航者的系统群集运动控制的研究结果中，往往需要对系统的信息交互施加更加苛刻的约束条件，即或者领航者的速度为恒值[21; 22]，或者领航者的加速度信息可被所有跟随者精确获知[23-25]。
　　此外，目前有关多智能体群集运动控制算法中的连通性保持问题的研究往往只涉及通信网络拓扑为无向图的情形，所考虑的智能体的运动模型也多为相对简单的一阶、二阶线性积分器模型。因而，导致其存在下述固有缺陷：研究中假定智能体均不具有非线性动力学模型或者其具有的非线性动态可以完全线性化。然而实际应用中，智能体的运动学/动力学模型通常会包含本质非线性动态[8, 26, 27]。特别地，对于工业和军事应用，当处理非完整约束轮式移动机器人和非完整约束机械手的协调与协作时，必须充分考虑其运动学/动力学模型中所包含的本质非线性动态[28, 29]。此时，传统的仅针对线性积分器系统而设计的群集控制算法显然无法使用。大多数连通性保持群集控制算法的设计均针对无向网络[11; 13; 30; 31] 或有向平衡网络[13]。然而实际应用中，由于各智能体所配备的通信和感知设备在功能和结构的异构性以及自身硬件信息传播和接收能力的互异性，系统的通信拓扑大多只能用有向网络描述，从而导致智能体间的信息交互关系不完全对等，因而使传统的面向无向对称网络拓扑而设计的群集控制算法在信息交互发生对称性破缺的条件下无法使用。
　　目前，关于多智能体系统群集运动控制中的网络连通性保持和避障控制问题，绝大多数相关算法存在如下不足：绝大多数连通性保持控制算法需要保持网络中所有现存的拓扑连接，这往往会产生很多不必要的冗余拓扑连接，因而使智能体的运动范围具有较大的局限性，这将导致网络的整体性能指标下降，严重时可能无法完成指定的任务目标。特别地，如文献 [4] 所述，保持网络当前所有的拓扑连接可能会阻碍期望群集构形的实现。在很多情形下，实际的网络拓扑结构高度复杂，很难使网络中所有的通信连接的长度彼此相等以实现理想的晶格状群集几何构形。此外，绝大多数群集运动控制算法基于平面型网络拓扑结构模型，网络模型本身缺乏良好的可扩展性和对任务及环境的适应性。尽管现有文献中已有很多关于群集运动中的避障控制和连通性保持的结果，但是对于它们的研究往往人为地彼此割裂，没有形成统一的整体。对于运动控制过程中同时实现连通性保持与障碍物规避的问题至今仍然是一个开放性问题，具有很大的挑战性。尽管文献 [19] 和 [20]中使用导航势场函数初步实现了连通性保持和障碍物规避，然而，其理论结果只适用于用一阶线性积分器模型描述的多智能体系统。而且，其相关理论结果成立的假设前提为：系统中几乎不会同时发生多于一对的智能体之间的彼此碰撞；对于同一智能体，当其即将与某一邻居智能体或某一障碍物发生碰撞时，不存在另外与其邻接的智能体即将脱离彼此的通信范围。不仅如此，传统的基于人工势场函数的避障方法的基本原理为驱使智能体沿着表征障碍物势场的排斥势函数的负梯度的方向运动，这类方法的共同缺陷为容易使系统陷入偏离期望目标的局部极小点，从而可能使系统无法完成期望的控制任务。
　　1.2 多智能体一致性控制概述
　　一致性定义为：随着时间的演化，一个多智能体系统中的所有智能体的某个或某些状态趋于一致，一致性问题是多智能体系统*基本的控制问题。一致性协议是智能体系统中个体之间相互作用的过程，它描述了每个智能体和与其相邻的智能体的信息交换过程。
　　一致性用数学表达式描述为：假设多智能体系统中有n个智能体，第j个智能体的状态用表示，如果当时，有，则称系统达到了一致。
　　一致性算法的基本思想是每个智能体利用智能体网络传递信息，设计合适的分布式控制算法，*终使智能体动力学与智能体网络拓扑耦合成复杂系统，从而实现状态的一致或者同步。如果系统之间的通信网络允许连续的通信，或者如果智能体网络通信带宽足够大，则每个系统的状态信息的更新可用微分方程来表示。另外，如果智能体之间的通信数据以离散的形式交互，则智能体状态信息的更新使用差分方程来建模。
　　一致性问题在计算机科学领域已经有了很长的研究历史，并且奠定了分布式计算的基础[32]。近年来一致性问题在多智能体系统中研究的兴起很大程度上源自文献 [2] 和 [33] 的工作。文献 [33] 提出了一个用计算机来模拟群体行为的 Boids模型，并给出了智能群体行为应满足的规则。Vicsek 等[2] 简化了文献 [33] 的模型，提出了一种离散多智能体模型来模拟大量粒子涌现出一致行为的现象。随后，文献 [10] 用矩阵方法和图论知识给出了该模型收敛性的理论证明，指出只要满足联合连通，粒子的运动方向就会达到一致。Olfati-Saber [34] 在 Jadbabaie [10] 的基础上针对无向图从控制理论的角度建立了解决一致性问题的理论框架，指出如果网络拓扑是强连通的，则智能体能实现一致。不同于Vicsek模型，文献 [35] 提出了一种 m-nearest-neighbor 规则，该规则同样可以实现多智能体系统的一致性。Ren等 [36] 将强连通的拓扑条件弱化为只要在一段时间内网络拓扑子图的联合图包含一条有向生成树，则系统可实现一致性。Huang 等[37] 通过研究多智能体系统的输出调节，实现多智能体系统的一致性。此外，文献 [38] 通过结合自适应控制与势函数方法解决领航跟随一致性问题，并应用多种势函数实现了群集的一致性。文献 [39] 针对平均一致性问题，分别给出了连续时间和基于采样的一致性协议。Feng等[40] 采用事件驱动的机制实现多智能体的一致性，并且通过构建自驱动模型，避免了累计误差的产生。文献 [41] 在离散时间一致性问题的研究中提出了一种*优控制增益的方法，促进多智能体系统一致性的收敛。文献 [42] 研究了离散时间多智能体系统中，有、无领航者存在情况下的一致性问题。文献 [43] 研究了有限域的领航跟随一致性问题。文献 [44].[46] 分别对实际物理条件下存在通信延迟、拓扑动态变化、相对状态测量误差时的一致性进行了研究。Cheng 等[47] 提出了一种基于扰动观测器的动态增益技术，用来估计非线性系统产生的扰动，并在此基础上提出了一种一致性协议。在上述工作的基础上，许多学者对多智能体系统一致性问题进行了广泛的研究。
　　1.2.1 低阶积分器多智能体一致性
　　文献 [32]、[48].[52] 回顾了一致性算法的发展过程。目前，许多涉及多智能体协同控制的文献深入研究了一致性算法[10; 34; 36; 53-55]。一致性算法的某些结果也可以在研究关联稳定性 (connective stability) 的文献中找到[56]。一致性算法已应用于编队集结[26; 57-63]、编队控制[53; 64-69]、群集[3; 4; 8; 70-74]、姿态校准[75-78]、环境监控[79]、非集中任务分配[80] 和传感器网络[81-84] 等领域。
　　一致性算法的基本思想是对每个智能体的信息状态赋予相似的动力特性。如果编队通信网络可以连续通信，或者通信带宽足够大，那么每个智能体的信息状态更新律可以用微分方程模型来描述。另外，如果编队中的通信数据是以离散数据包的方式传递，那么每个智能体的信息状态更新律可以用差分方程模型来描述。本节对每个智能体都采用低阶微分方程或低阶差分方程来更新其信息状态。
　　考虑由单积分动力系统确定的编队信息状态：
　　(1.1)
　　式中，和分别为第i个智能体的信息状态和信息控制输入。
　　一种连续时间一致性算法是
　　(1.2)
　　式中，aij(t)是t时刻、邻接矩阵 An(t) 2 Rn￡n 的第 (i，j) 项元素。
　　对于任意，如果在任意时刻，则aij(t) > 0，否则 aij(t) = 0。
　　显而易见，每个智能体的信息状态会趋向于其邻居节点的信息状态。式(1.1)和式(1.2)可以写成如下矩阵形式：
　　(1.3)