我为什么要做生产支持?

2020-09-22 11:33:52

我几乎每个月都会从团队中至少有一名产品工程师(特别是新员工)那里听到这个问题。在这篇博客中,我将尝试用我在Gojek做生产支持的经验来回答这个问题,Gojek是一个印尼的超级应用,有18个以上的产品。

目前,我正在领导一个名为Ironbank[1]的团队,该团队负责运输产品的盈利。运输产品负责将人们从印度尼西亚、新加坡、泰国和越南4个国家的A点转移到B点。

我们还没有专门的生产支持人员。在运输集团,我们有3名产品工程师负责生产支持。这些人每周轮换一次。因此,这篇博文是在一家规模可观的公司的背景下发布的,没有专门的SRE人员。

在我的第一天,我看到gojek停机了大约40分钟,因为google map directions api开始在响应🙂中返回html代码。那是紧张的一天。公司里几乎每个人都在待命提供生产支持。我看到很少有人负责与客户支持人员的沟通,让他们了解最新的问题。几乎没有人试图联系谷歌支持部门,让ETA解决问题。来自Transport的两名工程师正在构建Google Maps Directions API的后备机制。在那个时候,交通运输是相当精干的。产品团队有大约7名产品工程师(包括前端)和两个PM。经过两天的“培训”,我的导师让我做生产支持🙂。

起初,我挣扎了很多。这主要是因为三个原因:1)Gojek没有任何关于生产支持的流程;2)Gojek架构和规模太大;3)我没有任何做生产支持的实际经验。长话短说,我在生产支持部门工作了将近两个月,我想说那些日子帮助我成长为一名工程师。我感到学习曲线陡峭。

我培养了客户同理心看到成千上万的司机因为我们的一个数据库虚拟机重新启动了😦而无法获得投标/预订,这让我非常激动。

有一天在雅加达时间下午5点左右,数千名客户被困在他们的办公室里,因为我们忘记了将一列的数据类型从整数更改为大整数(整数溢出)。

生产支持帮助我找出了我们系统中的架构问题。这也帮助我找出了技术债务项目。

在生产支持期间,我在公司遇到了很多(优秀的)产品工程师,并从他们身上学到了很多。