谷歌承认Kubernetes容器技术过于复杂

2021-02-26 13:34:27

Google已经意识到用户在正确配置Kubernetes方面存在困难,并推出了一项新的Autopilot服务,以简化部署和管理。

每个人都知道的关于Kubernetes的两件事是:第一,它在至关重要的容器编排空间中获胜;第二,它的复杂性既是采用的障碍,也是常见的错误原因。

甚至Google(Kubernetes的发明者和最大推动者)都承认这种情况。尽管有了6年的发展,Kubernetes仍然非常复杂," Google Kubernetes Engine(GKE)产品负责人Drew Bradstock说。在过去的一年左右的时间里,我们看到很多企业都在使用Kubernetes,但是后来他们陷入了困境。

GKE是一个Kubernetes平台,主要在Google Cloud Platform(GCP)上运行,但也可以在Anthos的其他云或本地运行。

这是Autopilot的基本原理,Autopilot是GKE的完全托管部署,只要它在GCP上运行即可。但是GKE还不是托管服务吗?是–区别在于,自动驾驶仪比普通的GKE更自以为是且自动化程度更高。

Kubernetes具有群集(一组物理或虚拟服务器),节点(单个服务器),pod(代表节点上一个或多个容器的管理单元)和容器本身的概念。 GKE已完全管理到集群级别。自动驾驶将其扩展到节点和吊舱。

为了了解自动驾驶仪的功能和局限性,最好的查看方法是在此处,请注意标记为“预配置”的选项,这意味着它们无法更改。

从本质上讲,这是购买和管理GKE资源的另一种方式,灵活性较低,但便利性更高。由于Google管理着更多的配置,因此它为多个区域中的自动驾驶仪吊舱提供了99.9%的正常运行时间SLA。

在Google的云中,区域由三个或更多区域组成。将所有资源放在单个区域中的弹性要小于将它们分散在多个区域中的弹性,而将故障转移扩展到多个区域则可以最大程度地提高弹性。自动驾驶仪群始终是区域性的,而不是区域性的,这有利于恢复,但成本较高。

Autopilot的其他限制条件是,操作系统始终是Google自己优化的容器。带容器的Linux,不带Docker的Linux,也不带Windows Server。每个节点的Pod的最大数量为32,而标准GKE上为110。

没有对节点的SSH访问。自动驾驶仪节点被锁定。尽管已计划将来对GPU和TPU(张量处理单元)的支持在Autopilot中不可用。 "删除SSH很重要,"布拉德斯托克说。这在某种程度上是有限的,但是Bradstock告诉我们,它是基于研究的结果,在这些研究中,人们出于最佳意图错误地配置了事物。

定价模型也有所不同,它基于Pod使用的CPU,内存和存储,而不是基于所使用的计算引擎实例(虚拟机)。每个自动驾驶仪集群每小时收费0.10美元。对于每个群集,GKE标准还每小时收取$ 0.10的费用;您只需支付一次,但不能同时支付。

Autopilot或GKE标准是否更昂贵这一显而易见的问题并不容易回答。由于这是一种高级部署,因此Autopilot的成本将比经过精心优化的GKE标准部署高。 "比普通的GKE有溢价,"布拉德斯托克说,因为我们已经获得了SRE(站点可靠性工程)的完全支持和SLA支持,所以不仅仅是功能。

就是说,由于难以估计计算实例的正确规范,因此未充分利用的GKE标准部署的成本可能会高于自动驾驶仪。

为什么不仅仅使用Cloud Run,即使它仍在GKE上运行,它也可以在不配置群集,节点和Pod的情况下部署和运行容器工作负载? " Cloud Run是一个自以为是的开发人员环境,一个应用程序可以从零旋转到1,000,然后又回到零,这就是以云计算为目标的应用程序,"布拉德斯托克告诉我们。 "自动驾驶仪适用于希望减少工作量但仍希望使用Kubernetes,希望能够看到所有内容,想要使用第三方脚本,想要构建平台的人。

与附加组件的兼容性是否在Autopilot受限的环境中成为问题? "有些东西在第一天就不会起作用," Bradstock表示,尽管已经支持某些第三方工具,例如Datadog监视,并且DaemonSets是Kubernetes的一种功能,用于在每个节点上运行服务,但许多附加组件都在使用。

存储,计算和网络的配置意味着"我们必须放弃某种程度的灵活性和某些连接,"他告诉我们。 "但是我们绝对希望第三方生态系统能够在其上运行。

自动驾驶功能意味着Google提供了更多种类的Kubernetes选项,从大多数到最少动手。权衡不仅是更高的成本和更少的灵活性,而且是企业管理员可能面临的麻烦,尽管有人认为企业应该将重点放在提供业务价值的内容上,而不是第三方可以满足的要求上。

Google的工程比其客户支持享有更好的声誉。软件工程师凯文·林(Kevin Lin)曾是亚马逊的前任,他最近写了自己作为AWS与Google的新客户的经历。

他说,谷歌速度较慢,帮助程度较低,最终将他推荐给第三方合作伙伴。 "最初的入职电话完全是关于我计划在Google上花多少钱(而不是亚马逊希望他们帮助我设计服务的亚马逊电话)。 Google Cloud确实具有出色的人体工程学设计和世界一流的工程师,但是在客户支持方面享有很高的声誉。我的轶事经验似乎支持了这一点,"他说。

证明(如果需要的话),良好的工程设计并不是GCP增加其云市场份额的唯一因素。 ®

注册-技术社区的独立新闻和观点。 情境发布的一部分