假期期间应召唤工程师的提示

2020-12-22 12:54:15

您是否正坐在可可饮料旁,暗中担心您是否必须在任何时候灭火?

如果只有每个人都可以享受度过美好时光的休假生活,那么本周会更加轻松,但是保持我们的世界运转的技术并没有休息。本周某些行业正达到度假高点,DevOps,SRE和随处待命的工程师将不得不穿上隐形的超级英雄斗篷,像往常一样保持人类与设备的连接。

在Transposit,我们深知通话中的痛苦,因此,我们共同提出了一些重要建议,以尽可能减轻因轮班休假带来的痛苦。

无论来电者是打算举办罗克韦尔圣诞节,还是用Bubbe点燃烛台,出国探亲,还是在两个联邦假日填补假期请求时进行热带旅行,圣诞节与新假期之间的假期周都有一个一致的事实年:从办公室大量外流。因此,在没有人来帮助您的情况下,甚至在回答页面挑战之前,您如何首先避免这种难题?

值班的工程经理应谨慎调整通话时间表,以使同一个人不会在多个高峰时段上班。哪个时间最痛苦取决于个人,因此让每个人都有机会注册最适合他们的方法始终是最佳实践。也许有人不介意在圣诞节早晨打来电话,但绝对不能在新年前夜这样做。首先让人们选择最适合自己的东西,然后填补剩余的空白,确保不要过度负担团队中的任何一位成员。

在制定通话计划时,请确保每个班次都有主要和次要人员,因为出事时,他们可能会一起工作,而无法快速访问团队的其他成员。

为了进一步减轻痛苦,可以考虑增加整周的通话奖金,作为进行不希望的轮班的诱因,一旦所有人在一月份回到办公室,请务必确认那些迅速做出响应以保持业务发展的来电者跑步,而其他所有人都在享受下班时间。

如果无法轻松访问团队的其他成员,那么在此期间,良好的剧本/练习手册文档将比今年其他时间更为重要。如果您的典型待命过程涉及打开协作团队的Slack线程或Jira票证,然后让各种专家或高级SRE参与进来,那么当您在假期期间将可靠的专家作为MIA时,您可能会面临粗鲁的觉醒。

确保您的运行手册已更新,并且每个人都可以在休假之前每个人都可以轻松访问所需的DevOps系统,因为如果让调用者自己搜索半空的Wiki,那么解决速度将对每个人都造成压力-工程师,经理和高管都一样。

此外,请确保主要和次要呼叫者确切知道他们与特定班次配对的对象。确保两个人都致力于在轮班期间完全可用并保持清醒,以便在没有整个团队的情况下,他们可以安全地拥有至少一个解决问题的伙伴。

计划在轮班期间安排旅行似乎很明显,这样您就可以随时待命,但是如今,我们有时对旅行期间的连通性抱有很大的信心。机场,甚至有些飞机上都有wifi,许多飞机座位上都有内置的电源和插孔,这可能会出什么问题?

请记住,本周是美国一年中最繁忙的旅行周之一,因此,在最佳情况下,我们本已紧张的基础设施将处于运力的边缘。如果您站在2小时长的机场安全线中或在上山途中坐在交通拥堵中,则无法很好地解决故障。将不可预测的冬季天气添加到混合中,我们在制作过程中遇到了灾难。那么,来电者应该怎么做?

首先,您应该为轮班时间安排更宽的行程范围,以免意外无法使用。您也不应该指望航班上可以使用wifi(仅配备了某些飞机,而航空公司经常会根据天气和机械问题改变哪架飞机在某条航线上飞行)。不要指望在机场用电来为您的计算机或电话充电,因为大量旅客可能容易使充电站充满电,并确保您可以轻松使用计算机和充电器,因此如果被迫要在拥挤的航班上登机托运行李,您一定要把这些贵重物品留在自己的身上。

值班的旅行者还应该记住时区是一件事情-您的待命计划需要相应地进行调整。如果您是中学,则您的小学可能在不同的时区(反之亦然),因此您应该事先与他们讨论您的计划,以便为他们准备在不同的时间入睡。

最后,如果您在天气恶劣或无法可靠访问互联网的任何地方旅行,则应制定备份计划,例如将计算机与手机的数据服务绑定,以避开不可靠的wifi。如果您到达目的地并意识到自己的数据服务质量差,无线网络不稳定或出现断电的可能性,则应及早承认失败,并找一位有理解力的同事采取行动,而不是希望自己有所作为。并将所有警报留给您的备份。

我们已经讨论过中学作为解决问题的合作伙伴的重要性,但是在这段时间内,其他待解决的社会挑战又如何呢?假设您要坐下来享用一顿美好的家庭晚餐,就像您害怕的一样,电话响起并发出紧急警报。您将如何向亲戚解释这种情况?在很多情况下,亲戚并不真正了解您的工作?

在这里,一个友好的盟友可以在您的社交环境中帮助您作为中学。如果您用谈话要点为兄弟姐妹或支持性伙伴武装,以解释为什么您必须从节日的餐桌上站起来,疯狂地蹲在后面房间的笔记本电脑上,那么您将可以专注于故障排除而不必担心家庭的烦恼。

毋庸置疑,而且经常如此,这是有理由的,尽管世界有独特的环境,但本周世界运转如此平稳。尽管很多功劳归功于整年剩余的时间里出色的工程和团队规划,但总会有无法预料的意外事件无法避免。这就是为什么首先需要轮班,DevOps和SRE的原因!因此,回顾过去一年,在2019年特别活动的最后一周解决了这些事件,让我们记得向所有努力实现这一目标的工程英雄大声疾呼。祝贺你!