谷歌的研究人员表示,他们正在开发一种人工智能系统,可以自动将网页转换为短视频。它从HTML源中提取文本和图像等资源及其设计样式(包括字体、颜色和图形布局),并将资源组织到一系列快照中,同时保持与源页面相似的外观和感觉。
谷歌预计,该系统可能会对托管网站的企业有用,这些网站包含关于他们的服务或产品的丰富视觉表现。该公司表示,这些资产可以重新用于视频,有可能使那些没有大量资源的人能够接触到更广泛的受众。一段典型的视频价格在880美元到1200美元之间,制作起来可能需要几天到几周的时间。
URL2Video是在2020用户界面软件和技术研讨会上展示的,它自动从页面中选择关键内容,并决定每项资产的时间和视觉呈现方式。这些演示来自一组通过与设计师的研究确定的启发式方法,它们捕捉视频编辑风格,包括内容层次结构,限制镜头中的信息量及其持续时间,同时为品牌提供一致的颜色和风格。使用这些信息,URL2Video解析网页,分析内容,选择视觉上突出的文本或图像,并保留根据用户规范组织的设计样式。
URL2Video以每个网页为基础提取文档对象模型信息和多媒体材料,将视觉上可区分的元素标识为包含标题、产品图像、描述和行动号召按钮的资产组候选列表。系统捕获每个元素的原始资产(即文本和多媒体文件)和详细设计规范(HTML标签、CSS样式和呈现位置),然后通过根据资产组的视觉外观和注释为每个资产组分配优先级分数来对资产组进行排名。这样,在页面顶部占据较大区域的资产组将获得更高的分数。
URL2Video自动选择并排序资产组,以优化总优先级分数。为了使视频简洁,系统只显示页面中的主要元素,如标题和一些多媒体资产,并限制元素的持续时间。给出基于DOM层次结构的资产排序列表,URL2Video遵循从设计研究中获得的启发式方法来做出关于时间和空间安排的决策。系统将元素的布局转换为视频的纵横比,并应用包括字体和颜色在内的样式选择,调整资源的呈现时间,并将内容渲染为MPEG-4视频。
谷歌表示,在与谷歌设计师进行的一项用户研究中,URL2Video有效地从网页中提取了元素,并通过引导视频创建过程来支持设计师。谷歌研究科学家Peggy Chi和Irfan Essa在一篇博客文章中写道:“虽然目前的研究集中在视觉展示上,但我们正在开发新的技术,以支持视频编辑中的音轨和画外音。”总而言之,我们展望了这样一个未来:创作者专注于做出高层决策,ML模型交互地建议对多个平台上的最终视频创作进行详细的时间和图形编辑。“。
初创企业如何扩展通信: 这场流行病让初创企业密切关注如何提升他们的通信解决方案。学习如何