谷歌设计了自己的新处理器,Argos视频(Trans)编码单元(VCU),具有一个孤独的目的:处理视频。高效的新芯片允许技术巨头用自己的硅替换数百万英特尔CPU。
多年来,Intel'在其CPU内置的视频解码/编码发动机都主导了市场,因为它们提供了领先的性能和功能,并且因此易于使用。但是,定制的应用程序特定的集成电路(ASICS)倾向于优于通用硬件,因为它们仅设计了一个工作负载。因此,谷歌转向为YouTube的视频处理任务开发自己的专用硬件,并效果很大。
然而,英特尔可能会带着它的袖子,其最新技术可以赢得Google' S专业视频处理业务。
用户每分钟以各种格式上传超过500小时的视频内容到YouTube。 Google需要快速转发到多个分辨率的内容(包括144p,240p,360p,480p,720p,1080p,1440p,2160p和4320p)和数据有效格式(例如,H.264,VP9或AV1),这需要强大的编码马力。
从历史上看,Google有两个用于代码/编码内容的选项。第一个选项是英特尔' S视觉计算加速器(VCA),用内置的Iris Pro P6300 / P580 GT4e集成了带有领先的硬件编码器的Iris Iris Pro P6300 / P580 GT4E集成了图形核心。第二个选项是使用软件编码和通用英特尔Xeon处理器。谷歌决定任何选项都没有足够的功率效率,可以为youtube工作负载进行高效 - 视觉计算加速器相当于饥饿的动力,而缩放Xeon CPU的数量基本上意味着增加服务器的数量,这意味着额外的电源和数据中心占地面积。结果,谷歌决定使用定制内部硬件。
谷歌' s的第一代Argos VCU不会完全取代英特尔' S中央处理器,因为服务器仍然需要运行OS并管理存储驱动器和网络连接。在很大程度上,谷歌' S Argos VCU类似于GPU,始终需要伴随的CPU。
而不是我们在GPU中看到的流处理器,Google' S VCU集成了十个H.264 / VP9编码器引擎,多个解码器核心,四个LPDDR4-3200内存通道(具有4x32位接口),PCIe接口,DMA发动机,以及用于调度目的的小通用核心。除了内部设计的编码器/代码转换器外,大多数IP都是从第三方获得的,以减少开发成本。每个VCU还配备了8GB可用的ECC LPDDR4内存。
Google' S VCU背后的主要思想是将高性能编码器/代码转换器放入一个硅尽可能多的硅(同时剩余功率效率),然后与所需的服务器数分开缩放VCU的数量。谷歌将两个vcus放在电路板上,然后每台双插座英特尔Xeon Server安装10张卡片,大大增加了公司的解码/转码性能。
谷歌表示,与英特尔Skylake-Powered Server系统相比,其VCU的机器最多可见7倍(H.264)和高达33倍(VP9)的性能/ TCO计算效率的改进。这种改进占VCU(与英特尔' CPU)和三年的运营费用的成本,这使得VCU是视频Beemoth YouTube的简单选择。
从谷歌共享的性能编号,很明显,单个Argos VCU几乎没有于H.264中的双向英特尔天窗服务器。但是,由于20个VCU可以安装到这样的服务器中,VCU从效率的角度赢得。但是,当涉及到更苛刻的VP9编解码器时,谷歌' S VCU似乎比英特尔' S双插座Xeon快五倍,因此提供令人印象深刻的效率优势。
由于谷歌已经使用了几年的argos vcus,因此它清楚地取代了许多基于Xeon的YouTube服务器,其中包含运行自己的硅的机器。非常困难估计谷歌实际更换的许多系统,但有些分析师认为技术巨头可以为自己的VC提供四到3300万英特尔CPU。即使第二个数字是高估,我们仍然在谈论数百万个单位。
由于谷歌需要对其其他服务的处理器负荷,因此公司从AMD或英特尔购买的CPU数量仍然很高,并且不会在谷歌&#39之前的几年内随时下降;他自己的数据中心级系统上芯片(SoC)将准备好。它还值得注意的是,在目前尝试使用创新的编码技术(例如,AV1),谷歌即使对于YouTube而不是支持编解码器,谷歌需要使用通用CPU。此外,随着更有效的编解码器出现(在计算马力方面往往更苛刻),Google将不得不继续使用CPU进行初始部署。具有讽刺意味的是,专用硬件的优势将在未来增长。
谷歌已经在其第二段VCU上工作,支持AV1,H.264和VP9编解码器,因为它的需要进一步提高其编码技术的效率。目前尚不清楚新的VCU将部署,但很明显,该公司希望在可能的情况下使用自己的SOC而不是通用处理器。
虽然,英特尔ISN'仍然存在。公司'基于DG1 XE-LP的Quad-Chip SG1服务器卡可以将多达28个4kp60流解码,以及多达12个同时流的副码。基本上,英特尔' s g1确实是谷歌和#39; s argos vcu所做的:从服务器数量分开缩放视频解码和转码性能,从而减少用于视频应用的数据中心所需的通用处理器的数量。
凭借其即将到来的单幅XE-HP GPU,英特尔将同时提供10个高质量的4kp60流的转码。请记住,一些XE-HP GPU将扩展到四个瓷砖,每个系统可以安装多个GPU,英特尔' S市场领先的媒体解码和编码功能只会变得更加稳定。
谷歌已经设法建立了一个显着的H.264和VP9支持视频(Trans)编码单元(VCU),其可以在视频编码/转码工作负载中提供明显更高的效率,而不是英特尔'现有的CPU。此外,VCU使Google能够独立于服务器的数量缩放其视频编码/转码性能。
然而,英特尔已经拥有其XE-LP GPU和SG1卡,也提供了一些严重的视频解码和编码功能,因此英特尔仍然是在具有重型视频流工作负载的数据中心中成功。此外,随着英特尔' XE-HP GPU的出现,公司承诺巩固其在该市场的立场。
这些单一公司的效率将使竞争对手的市场进入越来越困难。它&#39很容易讨厌英特尔,但至少他们' ll卖给任何人。 Tech很棒。这些过程节点和铸造是什么?
回复