美式足球在荷兰长大,对我而言基本上是一个外国概念。我的足球版本是The BeautifulGame,或者像大多数美国人所知道的那样,足球。足球,足球,足球或任何您称呼它的东西,将永远是我最热衷的东西,尤其是我的家乡球队阿贾克斯。
当我加入亚马逊,西雅图成为我的新家时,我开始看到我的同事们对美式足球充满了同样的热情-尤其是当地球队西雅图海鹰队的狂热球迷,他们被称为“十二岁”。随着我开始更好地理解这种足球,我很容易对比赛以及幕后发生的事情感到兴奋。教练,决策者,甚至是播音员都在使用数据来做出实时决策,每个团队都在不断努力,以获得相对于对手而言只是一小部分的优势。
我发现足球最有趣的一件事是技术的发展如何对其发展产生影响。就近视而言,海鹰就是最好的例子之一,在采用机器学习(ML),物联网(IoT)和无服务器架构等新技术方面一直处于最前沿,可以从播放器的安全性到性能上的提高。场。
但是所有这些技术都是从数据开始的。因此,去年,Seahawks选择AWS作为其官方的云合作伙伴,并与AWS合作构建了一个数据湖,这是一个集中式存储库,允许组织以任意规模存储,管理,发现和共享其所有结构化和非结构化数据。
海鹰采用了无服务器架构,并使用诸如Amazon S3,AWS Lambda,AWS Fargate,AWS Step Functions和AWS Glue之类的解决方案来构建其数据湖和接收管道。他们的数据来自各种本地和第三方数据源,例如NFL NextGen Stats(由AWS提供支持),Pro Football Focus(也由AWS提供支持),来自IoT传感器的球员遥测数据以及基于第三方的加标比赛应用程序。
通过这个数据湖,海鹰希望改善人才评估和获取,球员健康和恢复时间以及比赛计划。让我们再仔细看看这三个领域,技术如何推动改进以及海鹰数据湖背后的架构。
从历史上看,橄榄球队通过让侦察员参加尽可能多的比赛并仔细检查录像带来评估潜在的球员。显然,这种方法有局限性,例如评估可能不够客观,这非常耗时。
因此,海鹰队使用AWSanalytics补充了传统球探以进行球员评估。首先,他们收集有关球员的数据,例如球员所在的学校的规模,比赛的位置以及他们在该大学队的比赛风格中所扮演的角色。然后,他们获取有关海鹰队的数据,例如他们自己的比赛方式,球队中的当前球员等,然后使用ML模型评估该球员是否合适。
在选秀期间,海鹰队使用这一分析可能会比其他球队排名更高的球员,从而使他们在选拔时能够进行权衡,并在选择更多选秀权的同时为球队选择合适的球员。这种类型的建模在自由球员市场期间也很有帮助,在此期间,海鹰队签下了一名为球队创造最大价值的球员,从而在不超支NFL工资帽的情况下产生了最大的影响。
除了拥有做出这些重要决策所需的正确数据之外,海鹰还拥有一个仪表板,可以使信息易于理解并采取行动。图1给出了海鹰为准备2020年草案而使用的那种分析仪表板的示例。
对于海鹰而言,没有比他们的球员的健康和安全更重要的了。这就是为什么他们在医务人员,力量和条件训练以及团队中每个人的营养上投入大量资金的原因。 Anddata在做出与玩家健康相关的决策方面也起着至关重要的作用。
每个玩家都会收到初始的基线健康评估。然后,海鹰队收集有关球员的持续信息,例如他们的运动水平,练习中的代表趋势,爆发式动作,锻炼频率等等。跟踪这些数据可以使海鹰队最大限度地发挥球员的利益,减少软组织损伤,并更好地理解他们从练习到比赛的负担。他们还使用这些数据来制定独特的训练计划,以优化不同运动员的运动才能,帮助运动员达到目标,并充分利用他们的表现。
以前,海鹰将这些数据存储在分段的数据桶中,这使得解析该信息变得困难。很难全面了解玩家的健康状况。现在,借助AWS上的数据湖,可以在一处轻松地访问此信息。而且,海鹰队可以实时评估球员的健康状况,帮助他们做出明智的决定,例如在受伤之前。
比赛日是足球迷们赖以生存的地方。但是,大多数人没有想到的是,体育组织每周需要花费数百个小时才能为一支球队准备60分钟的比赛做好准备。视频分析是一项对游戏规划过程至关重要的任务。
每个团队在一周内记录其实践,然后在电影室会议上进行细分。海鹰与亚马逊机器学习解决方案实验室合作,建立了自定义的ML模型,该模型可以自动识别场地上的球员和比赛类型。使用这些ML模型,Seahawks计划自动化视频分析中的许多手动过程。
播放器也可以细分此类视频分析。考虑到人才的获取,Seahawks数据科学家可以加载球员职业生涯中的比赛,并查看他们最成功的事,这可以帮助将该球员整合到某些方案中,并比以往更快地最大化其结果。例如,通过查看玩家的特征,它可能表明他即使在没有很多经验的职位上也会表现出色。
真正酷的是,Seahawks组织如何能够在所有不同目的下都从同一数据中提取延迟。而且,该团队真正地在AWS中利用了这么多种服务和功能-从机器学习到人工智能,再到数据库,分析,存储等等。
通过仔细考虑以上用例,很容易看到datalake在这里是正确的技术解决方案。而且,AWS提供了众多服务和技术,这些服务和技术非常适合在云中构建数据湖。
AWS Lambda函数通过启动AWS Step Functions来启动预定义时间表上的数据获取。步骤功能通过管理状态,检查点和重试来确保从头到尾的摄取工作流程,以确保摄取过程按预期顺序执行。
作为此工作流程的一部分,AWS Step Functions在AWS Fargate上启动独立的dockerimage,以查询第三方源API并将数据复制到S3存储桶中。 Fargate为每个容器分配了适当数量的计算,从而无需手动选择实例和扩展集群容量。由于Fargate无服务器,因此Seahawks可以避免扩展,修补,保护和管理服务器的操作开销。
在将数据提取到S3存储桶中之后,Amazon Glue会对数据进行爬网,并使用预构建的分类器构建数据目录。通过在Glue上维护最新的数据目录,Seahawks可以快速发现和搜索多个AWS数据集,而无需移动数据。
除了第三方API,Seahawks还需要从本地关系数据库和数据仓库中提取数据。 AWS DatabaseMigration Services使他们能够轻松安全地将数据从各种源数据库和数据仓库中拉出,并在将数据加载到Amazon Redshift之前将其放入S3中。这允许数据在ML和其他用例的数据湖中可用,同时确保可以将预期用于分析查询的数据有效地加载到AmazonRedshift。
如果提取工作流出现任何故障,则底层APIcall将记录到AWS CloudWatch Logs。然后,AWS Step Functions将使用Amazon Simple Notification Service通过电子邮件将有关失败的信息通知给Seahawks数据分析团队。
自从去年宣布AWS是Seahawks的官方云提供商以来,Seahawks数据湖已经运营了七个月,他们已经在人才评估和收购,玩家健康和恢复时间以及游戏计划方面看到了价值。
尽管美式足球是我见过的最激动人心和最体育运动之一,但这一运动年度继续给我留下深刻印象的是这些天来参与运动的见解,数据和技术。像西雅图海鹰队这样的成功足球队不仅需要像拉塞尔·威尔逊这样的MVP候选人,还需要一支强大的技术专家团队和地球上一些最好的技术在幕后共同努力,才能在这样的联盟中获胜。而海鹰队本赛季的表现(6-3并列NFC西部第一名)得益于每一场比赛日的所有精心准备,其中一些直接来自这个数据湖。我知道整个足球组织需要很多人才能让一支团队进入超级碗,而AWS自豪地在Seahawks的成功,现在以及未来中扮演着很小的角色。