视频矢量化-将基于艺术线条的视频大小减少约95%

2020-07-20 15:09:51

Vectorly正在开发一种新的视频压缩技术,它利用计算机视觉和矢量图形技术,将视频内容的比特率比HEVC降低一个数量级(或更多),同时提高视频质量。

这将主要是有效的矢量友好的视频内容,其中将包括动画,屏幕播放,许多电子学习视频和潜在的3D游戏内容。

通过利用所有设备上现有的矢量图形渲染功能,此编解码器不需要最终用户、原始设备制造商或浏览器安装特殊软件即可播放这些视频。

该项目背后的核心见解是,您可以使用基于矢量图形的动画来模拟视频,其方式与传统的基于光栅图形的视频格式(如MP4容器中的H264视频流)没有什么区别。

普通视频,就像你在Netflix或YouTube上看到的那样,只是屏幕上快速更新的图像序列,以创造运动的错觉。每幅图像都由独立的色点组成。更高的分辨率意味着更大的像素、更好的视觉质量和更大的文件大小。

互联网上几乎所有的视频都是这种格式,也就是众所周知的光栅图形。像H264这样的视频压缩算法在使用较少的数据点来重建任何给定帧中的像素以及仅存储视频帧之间的像素差异方面非常有效。

相反,我们使用一个称为矢量图形的概念来渲染视频。代替像素,我们用形状、直线和曲线来表示屏幕上的一切,它们可以用数学公式(矢量图形)来表示。

使用这些数学公式,我们可以在屏幕上重新绘制任意形状--从字母到巴特·辛普森的头像。此外,通过添加颜色、屏幕位置以及它们如何随时间移动或改变形状等信息,您可以创建完整的视频-包括整个“辛普森一家”剧集,只需一系列数学方程式。

这个项目背后的核心见解是,对于某种矢量友好的视频内容,使用矢量图形存储视频将比使用光栅图形效率高得多(在某些情况下,效率高达2个数量级)。

这个想法与大约20年前基于Flash的动画的想法没有实质性的不同。为什么现在要这么做?

不需要解码器:大多数设备现在支持SVG、HTML5、WebGL/OpenGL和/或某种形式的硬件加速矢量图形渲染。这使您可以在任何设备上呈现矢量图形内容,而不需要最终用户、OEM或浏览器安装特殊软件来实现矢量图形内容的回放,并通过这样做来实现本地级别的性能。应用程序开发者只需要在他们的网站或应用程序中包括适当的库或SDK,就可以在原生或第三方视频播放器中播放。

计算机视觉:我们的专利矢量化技术在很大程度上依赖于计算机视觉将光栅图形视频转换为矢量格式。利用计算机视觉的先进性和商品化,以及在云上运行批量计算机视觉繁重任务的简便性,现在大规模矢量化大量视频是可行的,这在5年前都是不可能的。

我们正在构建基于现有标准(SVG、WebGL和amp;OpenGL)的视频格式,使用Javascript对其进行扩展,以启用时间轴和关键帧等视频功能。我们将生成的视频数据打包到一个MP4容器中,该容器可以使用现有的视频基础设施(如HLS/DASH和DRM系统)进行流式传输和分发。

我们是务实的,不想为了创建标准而创建标准。为此,我们已经创建了库和SDK,这些库和SDK可以使用标准/原生接口(如下所示)回放我们的矢量图形视频。

我们的第一个动画概念的矢量化证明是位于这里的17秒的“辛普森一家”剪辑。请记住,我们的技术仍处于非常早期的阶段,这还有很多优化工作要做。

我们的技术也非常适用于电子学习,特别是可汗学院风格的内容。你可以在这里找到30秒的可汗学院片段