也许我需要为经理们写一篇名为“随叫随到”的博文。如果你要求工程师随叫随到索取他们的代码--你应该这样做--那么你就欠了:
-有足够的时间修复断手来做工作-密切跟踪他们被打断/叫醒的频率-等等。
很少有工程话题能像OnCall那样引起如此激烈的评论。每个人都有强烈的意见。因此,让我直截了当地说,要做好这件事,没有什么是绝对的,环境就是一切。适合一家初创公司的东西可能不适合规模更大的团队。规则是用来打破的。
这就是说,我对这件事确实有一些感觉。特别是当涉及到工程和管理之间的契约时。很简单,就是这样:
工程师有责任随时待命并拥有自己的代码。确保随叫随到不会搞砸是管理层的责任。这是一次握手,它是双向的,如果你不坚持自己的立场,他们应该退出并离开你。
对于为24x7高可用性服务编写代码的工程师来说,在生产中支持这些服务是他们工作的核心部分。(对于那些对此感到冒犯的人来说,有大量的软件工作不涉及构建高度可用的服务。)。在测试通过后将其抛给运营部只不过是一种几乎不加掩饰的工程分类法,您不能通过这种方式打破反馈循环来构建高性能的系统。
需要有人在非工作时间负责您的服务。这不能是事后的想法;它应该从一开始就在你的招聘、团队结构和薪酬决策中发挥重要作用。这些决定定义了你是谁,以及你作为一个团队所看重的东西。
不让自己掉进一个运营性的厄运深渊比从一个深渊中爬出来要容易得多。从一开始就把良好的操作卫生作为优先事项。重视好的、干净的、高层次的抽象,允许您将大片基础架构和运营负担委托给比您做得更好的第三方-无服务器、AWS、*AAS等。不要落入不尊重运营工程劳动力的陷阱,这是唯一可以拯救您的东西。
投资于良好的发布和部署工具。把这一部分作为你的工程路线图的一部分,而不是你在沙发垫上找到的东西。在合并后的几分钟内将代码投入生产,并观察有多少噩梦消失或永远不会发生。
投资于良好的仪器设备和可观察性。让您的工程师记住,当测试通过时,他们的工作还没有完成;直到他们看到用户在生产中使用他们的代码,他们才能完成工作。在整个软件生命周期中促进所有权意识。这就是dev.to是如何做到的。
深思熟虑地构建你的反馈循环。试着直接提醒做出损坏的零钱的人。永远不要向没有完全装备和授权来修复它的人发送警报。
当工程师随叫随到时,他们不负责正常的项目工期。这段时间是神圣的,致力于修理东西,制造工具,并制造护栏来保护人们免受自己的伤害。如果没有什么东西着火,工程师可以抓住机会修复一直困扰他们的东西。允许大量的代理和跟随一个人的好奇心,无论它可能导致什么,这将是一种特殊的款待。
密切跟踪您的团队收到通知的频率。认真对待任何超出工作时间的警报,并优先安排工作的优先顺序以修复它。夜间版面是心脏病发作,不是糖尿病。
考虑自己加入随叫随到轮换!如果没有别的,那就大方地夹击一下,定期做一个热心的后备人员。
可靠性工作和技术债务并不次于产品工作。将它们预算到您的路线图中,与您的功能和修复程序并驾齐驱。不要计划得太紧,以致于无法灵活应对意外情况。不要害怕回击产品,也不要忽视把它卖给你自己的老板。人们的生命掌握在你们手中;这就是你们拿钱做的事情。
考虑让非工作时间随叫随到是完全可选的。为什么不行?是什么让你远离它?把那些东西修好。对讲机就是这样做的。
根据您所处的阶段和可用的资源,考虑补偿。这不一定是现金,可以是每次待命轮换后的周五休息日。一家公司越成熟、越有资金支持,你就越有可能这样做,以便在组织结构图上显示出正确的激励措施。
一旦你把自己从消防模式中解脱出来,就投资于SLO(服务水平目标)。SLOS和可观察性是摆脱反应性模式并基于权衡和用户影响计划工程工作的成熟方法。
我相信完全有可能建立一种100%选择加入的随叫随到轮换,一种骄傲和成就的徽章,一种给人们的工程角色带来意义和掌握,并将他们与用户情感联系在一起的东西。我相信随叫随到是你可以真诚期待的事情。
但每一家公司都是一片独特的复杂的社会技术雪花。改变随叫随到是负担还是祝福的脚本将需要一个独特的解决方案,以满足您的特定需求并借鉴您的特定历史。这需要修修补补。这需要维修。
最重要的是:✨提高您的标准✨,满足您对自己的期望。你最大的敌人是你多么容易接受现状,然后为为什么必然是这样编造借口。你可以做得更好。我知道你可以的。
我不在乎这是否会导致产品开发陷入停顿。在稍长一点的时间内摊销它,它就会比自己赚得更多。Https://t.co/JSck2u86ff。
当谈到为你做随叫随到的工作时,有很多很多现有的技术,你应该深入研究一下。看一些演讲,读一些文章,和一些人交谈。但然后你将不得不自己创业,并尝试一些东西。追逐别人的解决方案总是错误的答案。
任何混蛋都可以写一些代码;长期拥有和管理复杂的系统是困难的部分。你如何选择承担这一重担将深刻地反映你的价值观和作为一个团队的你是谁。
如果你的随叫随到体验是强制性的,严重影响你的生活,如果你不认真对待这件事,并尽快修复它呢?我希望你的团队离开你,去找一个真正珍惜他们时间和睡眠的地方。