Hi!请登陆

前沿 | 基于博弈论的预警卫星系统抗毁性研究

2020-11-21 35 11/21


原标题:前沿|基于博弈论的预警卫星系统抗毁性研究
基于博弈论的预警卫星系统抗毁性研究
作者|齐小刚,陈春绮,熊伟,刘立芳
摘要:预警卫星系统在弹道导弹预警方面发挥着重要的作用,一旦受到攻击,将造成重大损失。针对这一实际情况,利用博弈论知识,将预警卫星系统的攻防过程构建为静态博弈模型。提出攻防状态下刻画系统抗毁性的方法,将其分为防御者抗毁性和攻击者抗毁性,在完全信息和不完全信息情况下,分析双方应采取的策略,用仿真得到的容量数据刻画节点受攻击后的失效概率,提出基于仿真数据的攻防策略。并根据仿真数据分析提出不完全信息下模型的优化方向。
目前空间领域竞争不断加剧,以卫星为主体的航天系统将是一体化全球感知、全球交战系统的核心,以美、俄为代表的国家已经认识到卫星系统特别是预警卫星系统在军事活动中起到的重大作用[2],在大力发展卫星的同时,也投入大量的精力研究反卫星武器,从这一方面来说,在保护己方卫星提高抗毁性的同时,利用反卫星武器来干扰、破坏乃至摧毁敌方预警卫星系统具有巨大的军事价值和战略意义。
因此,对于预警系统信息网络来说,攻击通常是不可避免的,考虑受到攻击情况下的系统抗毁性有着重大意义。本文以天基红外系统pace-baediaedyem,SBIRS为主要研究对象,基于博弈论,区别于传统的系统抗毁性,在攻击/防御框架下将系统抗毁性分为攻击者抗毁性和防御者抗毁性进行研究。
1
研究现状
1.1
天基红外系统SBIRS
天基红外系统SBIRS是美国建造的逐步取代原有DSP卫星系统的下一代导弹预警和跟踪系统,是由地球同步轨道卫星GEO、低轨道卫星LEO以及大椭圆轨道卫星HEO组成的复合型星座。SBIRS用来执行4项任务:导弹预警、导弹防御、技术情报和作战空间特征描述[3],是目前技术最先进的军事红外探测卫星,大大增强了美国的全球导弹预警能力。
SBIRS系统可分为三部分,即高轨道部分SBIRS-high,低轨道部分SBIRS-low和地面支持部分。
SBIRS-high由4颗GEO和2颗HEO卫星构成,SBIRS-GEO卫星主要用于探测和发现处于助推段的弹道导弹,SBIRS-HEO主要任务在于对北极地区的探测预警,将SBIRS的预警能力扩展到两极地区。SBIRS最大的改进是采用了双探测器方案,每颗卫星载有一台高速扫描型探测器和高分辨率凝视型探测器。卫星工作时,扫描型探测器先对地球进行快速扫描,然后将探测到的数据提供给凝视型探测器。紧接着,凝视型探测器将目标画面拉近放大,获取详细信息,进而确定是否发生导弹发射活动。双探测器协调工作,共同完成任务,有效增强了SBIRS探测弹道导弹的能力[4]。
SBIRS-low后更名为空间跟踪和监视系统STSS,设想由分布于3个高度为1600km轨道的24颗卫星组成,卫星之间利用60GHz的星间链路传递弹道导弹飞行中段的跟踪信息,提供立体的探测,实现对弹道导弹和洲际导弹飞行全过程的持续跟踪。通过与SBIRS-high的配合,为拦截导弹提供飞行轨迹及坐标。
地面支持部分由控制站、国外中继地面站、可移动终端及相关的通信设备组成。
1.2
抗毁性
关于抗毁性一直以来并没有形成统一的定义,抗毁性注重的是系统的关键部分遭受到攻击或摧毁,系统的恢复性和适应性,并在此情况下仍能完成关键服务的能力[5]。
目前,针对预警卫星的抗毁性研究甚少,针对卫星网络的抗毁性研究也局限于拓扑结构、路由方案、容量优化及星座架构等方面[6-9]。但是卫星网络工作在极其复杂的空间环境中,卫星节点之间的星间链路在任意时刻都可能发生随机故障,甚至遭受蓄意攻击,从而导致性能下降甚至完全损坏,这一情况下的抗毁性很少受到关注。
2
攻防博弈论
2.1
网络攻防博弈论
博弈论gameheoy是研究具有斗争或竞争性质现象的数学理论和方法,其实质是从对抗双方的角度出发,考虑各自的预期行为和实际行为,并研究它们的优化策略。博弈过程中,参与对抗的双方都试图寻找使得自己利益最大化的最合理的策略。
博弈论作为一种在竞争对抗环境下博弈参与方策略选择的理论,其与网络攻防行为所具有的目标对立性、非合作性以及策略依存性高度契合[10]。攻防双方选择各自的策略进行攻击与防御,在实际的攻防博弈场景中,防御者采取的防御策略和攻击者使用的攻击策略,双方均无法确定,例如防御者知道攻击者可能的几种攻击类型但无法确定,造成了信息的不完全性,攻防双方选取策略的过程可以看作不完全信息博弈过程。博弈图如图1所示。

图1博弈图
网络攻防对抗过程,即是攻击方对网络系统中存在的脆弱性加以利用,为达到某种损害网络系统的目标而采取一系列的攻击行动;防御方针对网络系统的性能要求及所遭受的攻击而采取一系列的防御行动,整个对抗过程的实质就是博弈的过程[11]。在这一过程中,攻击者的收益即为目标网络的破坏程度,而防御者的收益为网络正常运行满足需求。网络攻防博弈过程与传统博弈过程的对应关系如图2所示。

图2博弈要素对应关系
2.2
预警卫星薄弱环节
卫星本身的一些特性使卫星比地面系统更容易遭受攻击,且难以修复。
1卫星轨道固定,易被探测。人造卫星是环绕地球在空间轨道上运行的无人航天器,一旦发射,只能沿着预定的轨道飞行,仅仅为躲避反卫星武器攻击做微小变动都很困难,变轨更是需要付出极大代价。同时,卫星最主要的特点就是覆盖面广,但也使得地面上很容易观测到卫星,通过雷达等探测仪器可以很轻易地获得卫星的轨道参数。尤其是低轨预警卫星,轨道高度仅为1600km,一旦进入监视范围,会被立刻探测。因此,会受到反卫星卫星及动能反卫星武器的攻击,被直接摧毁。
2在激光武器攻击下卫星的组件性能下降乃至失效。使用激光武器可以使得卫星的一些部件性能受损,当能量密度达到一定阈值时,能对卫星造成更迅速的破坏,导致卫星中高压容器破裂、摧毁太阳能电池板、破坏表面热控制材料、损毁卫星天线等。对于光电探测器,当照射激光超过最大负载值时,将发生饱和现象,无法正常工作,尤其是预警卫星搭载的探测器,为了探测到导弹尾焰,灵敏度极高,使得饱和所需的功率更低。
3上下行及星间链路实时性要求高,易受干扰。预警卫星在探测到导弹的相关参数后,通过下行链路传送给地面控制站,同时卫星也需要通过上行链路获取指挥信息。在卫星工作时,星上数据处理系统会接收到大量数据并进行预处理,为了确保预警信息的实时性,必须建立高效的通信链路。正常情况下,由于无线通信易受干扰,链路会采用编码、加密等技术来抵抗干扰与欺骗。但是,攻击者利用与实际信号相同的频率但功率较大的干扰信号来扰乱卫星通信,或者加大功率并模仿真实信号的特征,使得地面无法接受信息或接收到虚假信息,星间和星地间无法正常通信,从而影响预警性能。
4低轨卫星需要组网才能完成全球覆盖。SBIRS-low轨道高度仅为1600km,运行周期短。为了更好地全程持续跟踪导弹飞行,必须组网才能实现对全球的覆盖监视。SBIRS-low协同工作,才能进行对导弹的监视跟踪,若对其中某些卫星实施攻击导致其失效,将会破坏整个系统的预警能力。
3
系统抗毁性
3.1
影响抗毁性的因素
系统的可靠性一般被认为是:在规定的条件下,系统在给定时间段内执行所需功能的概率。因此,在条件相同时,两个系统如果各方面均相同,则其有着相同的可靠性,即可靠性是静态的。抗毁性与其看似十分相似但却大有不同,抗毁性关注的是系统在受攻击后继续正常运行的概率,在攻击/防御框架下,这一概率会受到以下几个因素的影响:

1攻击者目标:干扰系统,完全禁用系统,对系统造成不可修复的最大损害等。
2攻击者资源:单次攻击或者可重复攻击,攻击所采用的技术手段等。
3攻击策略:系统禁用则停止攻击,攻击所有组件,攻击顺序等。
4防御者资源:第一次攻击后是否及时做出反应,拦截攻击的能力,虚假目标误导攻击等。
5防御策略:隐藏目标使攻击者无法接触,改变传输方式等。

3.2
抗毁性博弈模型
基于上述研究,在攻击/防御框架下,建立预警卫星的抗毁性问题博弈模型如下:

1参与者:预警卫星系统攻击者与防御者。攻击者:攻击预警卫星系统,干扰、破坏和摧毁卫星节点,降低系统性能。如果预警系统无法完成预警任务,则认为攻击成功。防御者:保护预警卫星系统正常运行,最小化系统失效概率,完成既定的预警任务。
2攻击策略集:攻击者选择攻击任意数量的卫星节点,以及攻击顺序和攻击方式。
3防御策略集:防御者采取最短路或者其他通信方式,选择不同的预警模式。
4攻击者收益:预警卫星系统被破坏的程度。
5防御者收益:预警卫星系统维持正常的预警性能。
6攻击方式:根据卫星受到攻击的实际情况,将攻击方式分为两类:一是直接摧毁,卫星节点及相连的星间链路全部失效,对应于卫星受到的硬杀伤攻击;二是卫星受到干扰,性能受到影响,抽象为饱和攻击、篡改攻击、删除攻击,对应于卫星受到的软杀伤攻击。

3.3
系统抗毁性
为了更好地从攻守双方刻画预警卫星系统抗毁性,将其分为防御者抗毁性和攻击者抗毁性。定义如下:

定义1防御者抗毁性是系统在攻击下存活的概率。
定义2攻击者抗毁性是攻击失败的概率。

在3.2博弈模型下,防御者为提高自身收益,会尽可能提升防御者抗毁性,而攻击者为了最大可能禁用系统预警功能,会选择合适的攻击策略,提高攻击成功的概率,降低攻击者抗毁性。
在完全信息的情况下,防御者将采取最大化预警卫星系统预警能力的策略,而攻击者也将针对这一策略进行攻击,防御者抗毁性和攻击者抗毁性在这种情况下一致,显然,这是一种零和博弈,其中防御者收益的任何增加都是以攻击者收益的减少为代价获得的,反之亦然。因此,防御者不会选择策略减少收益以使攻击者受益,防御者没有动力在当前完全信息背景下采取误导攻击者的举动,纳什均衡保持不变,攻防双方坚持最佳策略。
但是预警卫星系统完全信息基本不可能实现,在不完全信息的情况下,防御者采取不同的通信方式使得最佳策略不同,而攻击者不了解防御者策略,双方均采取随机策略。此时防御者和攻击者的最佳收益不一致,博弈被认为是不稳定的并且纳什均衡不适用。下面,以SBIRS-low为例,说明在不完全信息情况下,攻防双方选择的策略,以及防御者抗毁性和攻击者抗毁性的不同。
图3所示为SBIRS-low的网状拓扑结构,3条轨道,每条轨道均匀分布8颗卫星,协同工作完成预警任务。卫星暴露于外太空,轨道及拓扑结构极易被攻击方获取,但是防御方采取的通信策略则是保密的,如路由算法、拥塞控制方案等,在这种情况下,可选择的攻防策略如下:
防御策略:在博弈过程中,防御方是率先做出决策的一方,防御方所采取的通信方式和预警模式,决定了每颗卫星在系统中的作用,也就确定了其在受到攻击情况下失效的概率大小。防御者仍然选择最佳策略,也就是使得攻击时系统失效概率最低的策略,因为如果防御者网络的抗毁性降低,将有利于攻击者,与防御者的收益相矛盾。

图3SBIRS-low拓扑结构
此时防御者抗毁性与防御者选取的最佳策略有关。防御者在受到攻击后,应该如何应对以提高自身抗毁性,是后续动态博弈的主要研究内容。
攻击策略:考虑到有非常多的候选防御策略,保险起见,攻击者应该攻击卫星网络的点割集,一旦完全禁用该点割集,无论防御者采取何种策略,网络将无法连通,攻击成功。虽然这可以被视为攻击者采用的保守方法,但当攻击者目标为完全禁用卫星网络时,可以认为这是充分现实的。因此,攻击者应该做出最佳的攻击选择。换句话说,攻击者应该以攻击成功的概率来定位点割集,并依据攻击时可以继续操作的概率来确定攻击顺序。
在SBIRS-low中,为了确保卫星网络不连通,应该分别在每条轨道上选择不相邻的两个卫星节点进行攻击,从而使得网络不连通。目前暂不考虑由于极地的存在导致在高纬度区域,卫星轨道间链路不存在的情况。

相关推荐