复杂自适应系统:ITSM入门读本

2020-07-08 13:08:03

作为现代航空公司的客户,打开手机应用,只需简单点击几下,就可以换成不同的航班。对于终端用户来说,这项操作从未像现在这样简单。然而,这个看似简单的行动的现实是,在相互关联的数字事件的复杂网络中触发了大量事件。这些事件会立即发生,并且每个事件都会对系统的许多其他组件产生错综复杂的影响。

探索这种复杂性是很有趣的。它需要确定,例如,我是否可以免费进行这种更改,或者它是否需要付费。如果是后者,则需要处理支付,这可能涉及由我的电话的操作系统提供商运行的支付服务、中央信用卡路由服务和我的银行之间的交互。这些实体相互作用来执行验证,以确定我就是我所说的那个人,以及我是否有足够的资金来支付购买费用。当然,我可能不会选择用货币支付:我也可以选择使用以前积累的、与我的客户资料相关联的忠诚度积分。

与此同时,运营系统需要更新,这些系统将拥有多个所有者。机场系统需要确保我能够通过登机口进入离境航站楼。在我的起点和目的地,边境机构可能都需要被告知这一变化。乘务人员系统和行李处理数据将需要更新。

如此简单的改变带来的依赖不只限于航空公司,也不局限于我旅行所经过的机场。我可能会改变我在伦敦的办公桌上的航班,但悉尼的一家旅行社必须立即阻止任何同时试图将我新分配的座位出售给另一个人的行为。

航空票务是数字时代出现的那种巨大的全球系统的一个例子,它由一个错综复杂的相互连接的部分组成的网络组成,每个部分都有自己的起源、性质和行为。它是一个运行不断变化的系统,其中一个部分的事件以不是由任何单个架构师预先设计的方式影响多个其他系统。我正在与之交互的系统通过一系列有规律的独立扩展和更改,在多年中不断发展壮大。

我们越深入地探索这个系统,就越难看到它的边缘。这个系统是否只限於旅游业的系统,抑或我们要考虑到,只有当用户的电话接上数据服务,并由售电商提供的电子收费时,才能作出改变?这些电子是怎么到那里的呢?它们是由电网提供的,电网是一个同样复杂和多样化的相互作用的独立组件系统。

复杂适应系统的概念是最近才定义的(1996年,由Kevin J Dooley提出)。复杂适应系统是年轻的复杂性科学的关键组成部分,在生物、经济、交通和城市化等多个领域都有众所周知的复杂适应系统的例子。

要定义它们,我们可能需要为“系统”的一般概念建立一个基本定义。在Merriam-Webster字典中可以找到一个有用的描述:

系统思维通常根据系统的输入和输出之间的关系来考虑系统。线性系统是直截了当的,它展示了一种简单的比例关系(例如)。非线性系统的输出与输入不成比例,但通常是可预测和可理解的(例如,y=sinx)。

然而,复杂自适应系统并不表现出这样的确定性关系,也不遵循Merriam-Webster定义的延续,即系统将“处于或趋向于平衡”。相反,它们的属性是它们作为一组相互关联的实体的本质的产物,每个实体都有自己的行为。整体结构不是处于平衡状态,而是呈现出一种更具动态性、适应性的存在状态。

因此,虽然复杂自适应系统没有一个单一的、明确的定义,但它们确实具有许多公认的特征,这些特征使它们有别于更简单的系统。这些特征令人着迷,并且有很多空间可以更深入地探讨它们的含义(这也是我计划在本博客的后续文章中做的事情)。它们包括(但不限于):

复杂性:没有一个单独的正式模型足以捕获系统的所有属性,并且可以表示系统各部分的描述性模型不是彼此的派生模型。

自组织:系统的运行不仅基于其各个部分,而且基于它们之间的相互作用。系统的整体秩序不是一种平衡状态,而是在这些相互作用中不断演变的波动和反馈循环。

涌现:由于系统各部分的组合结果不是这些部分的属性的简单总和,因此通过建立和取消这样的组合,不断形成新的系统特征。

弹性:系统表现出通过吸收干扰和/或重组以维持其功能来对内部故障和不可预见的负面事件做出反应的能力。

观察者依赖性:系统的性质对于不同的人来说会有所不同,这取决于他们的特定观点。

路径依赖:系统现在的性质很大程度上受到过去决策和事件的影响,影响方式很难克服。

混乱:投入的微小变化可能会导致产出的戏剧性变化,而投入的巨大变化可能不会相应地造成产出的大变化。

不可还原性:对系统的转换不能总是恢复到以前的状态。

ITSM建立在某种确定性的哲学遗产之上,即定义和绘制服务,并保持一定程度的集中控制。例如,弗雷斯特(Forrester)分析师查尔斯·T·贝茨(Charles T.Betz)在2017年为我自己的雇主撰写的博客中写道:

尽我所能地重新阅读,我发现ITIL的总体叙述仍然是连续的、以计划为中心的,并且是确定性的。

由于DevOps的影响,这种心态最近已经向前迈进了一大步,而ITIL4在许多方面都是向前迈出的重要一步。复杂自适应系统本身在ITIL4框架的几个页面中进行了研究(在2020年初首次出版的高速IT书籍中)。这是受欢迎和有用的,但这只是一个开始。

我的观点是,对于ITSM专业人员来说,了解复杂自适应系统的存在是至关重要的,他们寻求维护、管理和支持的许多服务实际上都是更广泛的复杂系统的一部分。ITSM需要调整其工作方式,以完善适应性系统,但要做到这一点,我们需要推动人们更广泛地认识到这一概念的存在,并建立一个在实践中识别此类系统的社区能力。这对于许多方式是必要的,其中一些方式如下所示:

IT系统越来越复杂。例如,随着组织的数字化转型,一种越来越广泛、更深入、更相互联系的技术结构也在演变。在以前,系统在相对隔离的更简单、线性的基础上操作,组件之间日益增加的连接和依赖以及它们的持续发展速度倾向于将已建立的企业数字服务推入复杂自适应系统的领域。

不能仅从技术的角度来考虑大规模的数字系统。相反,大多数都是社会技术系统的例子,在社会技术系统中,系统既是支撑它的技术的产物,也是与之互动的人的行为和行动的产物,ITSM本身有一些坚实的社会技术基础,长期以来至少部分地建立在向客户提供商业价值的概念上。然而,正如Gordon Baxter和Ian Sommerville在2009年为圣安德鲁斯大学(St Andrews University)发表的一篇论文中指出的那样,“采用社会技术方法进行系统设计的理由是,如果不这样做,可能会增加系统无法为组织目标做出预期贡献的风险。

复杂的系统以不同的方式失败。事实上,正如我之前所探索的那样,复杂性理论通常认为,复杂系统处于多故障的持续状态,系统的基本弹性(可以从系统的结构以及通过操作和使用系统的人的操作来获得)可以缓解这种状态。关于这个主题的一篇开创性论文是理查德·库克的“复杂系统是如何失败的”。简而言之,我们需要能够识别系统何时是复杂的,并以与更简单的线性系统截然不同的方式对其进行管理。

这是更详细地探讨复杂自适应系统的关键特性及其对服务管理工作方式的影响的第一篇文章。

关于新兴的复杂性科学和复杂适应系统的概念,有很多很好的材料。一个很好的推荐是德尔夫特大学从其本科教学大纲中分享的一系列讲座,题为“基于Agent的复杂适应系统建模”。Igor Nicolik博士的入门讲座(@Complevo)是关于复杂适应系统的概念和特征的一本很好的入门读物。