SRE学校:非传统员工和新毕业生入职课程

2020-12-09 19:34:22

在2019年初,我们开始访问印度各地的校园,以招募最聪明的人才,以确保LinkedIn以及构成其复杂技术堆栈的所有服务始终对所有人可用。 Linkedin的这项关键职能属于站点工程团队和站点可靠性工程师(SRE)的权限,后者是专门研究可靠性的软件工程师。 SRE将计算机科学和工程学原理应用于计算机系统的设计,开发和操作:通常是大规模的分布式系统

在继续这一旅程的过程中,我们开始从这些园区中获得很多关于站点可靠性工程角色到底需要承担什么的问题。而且,某人如何学习成为一名成功的站点可靠性工程师所需的技能和学科?很快过去了几个月,其中一些校园学生以实习生或全职工程师的身份加入了LinkedIn,成为Site Engineering团队的一部分;我们也有一些不属于传统SRE背景的横向招聘人员加入了我们的组织。那时,我们中的一些人聚在一起,开始考虑如何将新的研究生工程师加入Site Engineering团队。

关于SRE的角色和职责,如何监视站点健康,生产事件,定义SLO / SLI等,网络上散布着大量资源。但是很少有资源可以指导某人掌握基本技能。设置一个初学者必须具备的条件。由于缺乏这些资源,我们感到个人很难进入该行业的空缺职位。我们创建了SRE学院,作为任何想要建立自己的SRE事业的人的起点。

在本课程中,我们专注于建立强大的基础技能。本课程以提供更多现实生活中的例子的方式来组织,并且学习这些主题中的每一个如何在日常SRE生活中发挥重要作用。目前,我们在SRE学院涵盖以下主题:

我们相信持续学习将有助于获得更深的知识和能力,以扩展您的技能组合,每个模块都添加了参考资料,可以作为进一步学习的指南。我们希望通过这些模块,我们应该能够建立站点可靠性工程师所需的基本技能。

在Linkedin上,我们正在使用此课程将非传统员工和新的大学毕业生纳入SRE职位。我们在与新员工的合作中获得了多次成功的入职经验,该课程帮助他们在很短的时间内提高了工作效率。这促使我们将内容开源,以帮助其他组织将新工程师加入该职位,并为有抱负的个人担任该职位提供指导。我们意识到,我们创建的初始内容只是一个起点,我们希望社区能够在完善和扩展内容的过程中提供帮助。请查看提供帮助的指南以开始使用。