TikTok揭示了其算法工作原理的详细信息

2020-09-11 21:30:43

TikTok周三披露了这一备受赞誉的算法的一些难以捉摸的工作原理,它让全球数亿用户继续沉迷于这款病毒式视频应用程序。

重要原因:TikTok用来挑选下一段视频的代码,是这家成立两年的公司获得广泛人气以及令人惊叹的200-300亿美元估值的很大一部分原因。由于担心TikTok与中国政府的关系,TikTok的中国母公司准备出售其美国业务,这一关键资产正在发挥作用。

推动新闻:TikTok高管周三在与记者的电话会议上表示,他们正在披露算法和数据操作的细节,以消除有关该公司的神话和谣言。

TikTok负责美国公共政策的副总裁迈克尔·贝克曼(Michael Beckerman)说,我们是一家成立两年的公司,有着成立10年的公司的期望。在互联网的黄金年代,我们没有机会成长,那时的科技公司不会犯错。我们成长在科技狂热的时代,在那个时代,人们对平台、它们如何调整内容以及它们的算法如何工作都持怀疑态度。

TikTok的高管们向记者们展示了其位于洛杉矶的新透明中心的虚拟之旅。该中心将为人们提供演示计算机模块的区域,这些模块展示TikTok的算法和数据实践是如何工作的。

特朗普总统将9月1日定为。15日是该公司的中国所有者ByteDance寻找美国买家的最后期限,否则它将在美国面临禁令。

中国最近对软件实施了新的出口限制,这可能会阻止TikTok的算法出现在任何销售中。

工作原理:TikTok的算法使用机器学习来确定用户最有可能参与的内容,并为他们提供更多内容,方法是找到相似的视频,或者有相似用户偏好的人喜欢的视频。

当用户第一次打开TikTok时,他们会看到8个热门视频,内容包括不同的趋势、音乐和主题。在此之后,算法将继续根据用户参与的视频和用户做的事情,为用户提供8个视频的新迭代。

该算法根据视频信息(可能包括字幕、标签或声音等细节)识别与用户参与的视频相似的视频。建议还考虑了用户设备和帐户设置,其中包括语言首选项、国家/地区设置和设备类型等数据。

一旦TikTok收集到足够的用户数据,该应用程序就能够绘制出用户与相似用户相关的偏好,并将他们分组到集群中。同时,它还会根据类似的主题将视频分组到集群中,比如篮球或兔子。

使用机器学习,该算法根据用户与其他用户集群和他们喜欢的内容的接近程度向用户提供视频。

TikTok的逻辑旨在避免可能让用户感到厌烦的冗余,比如观看多个带有相同音乐的视频或来自同一创作者的视频。

是的,但是:TikTok承认,它能够如此有效地锁定用户的偏好,这意味着它的算法可以产生过滤气泡,强化用户现有的偏好,而不是向他们显示更多样的内容,开阔他们的视野,或者向他们提供相反的观点。

该公司表示,它正在研究过滤气泡,包括它们能持续多长时间,以及用户如何遇到它们,以便在必要时更好地打破它们。

由于过滤泡沫可以强化阴谋论、恶作剧和其他错误信息,TikTok的产品和政策团队研究哪些账户和视频信息(主题、标签、字幕等)可能与错误信息有关。

链接到错误信息的视频或创作者会被发送给公司的全球内容审查员,以便在将其分发给主提要(称为“为您服务”页面)上的用户之前对其进行管理。

该公司表示,它试图在事件发生之前对其平台上的事件进行分类和预防,方法是在问题蔓延之前检测问题的模式。

TikTok首席安全官罗兰·克劳蒂埃(Roland Cloutier)表示,计划到今年年底在美国招聘100多名数据、安全和隐私专家。

他还表示,该公司将在华盛顿特区建立一个监测、反应和调查反应中心,以积极检测和实时反应危急事件。

大局:贝克曼表示,TikTok的透明度努力旨在将公司定位为硅谷的领导者。

他表示:我们希望占据领导地位,更多地展示这款应用的工作原理。对我们来说,我们是新来的,我们想这么做是因为我们没有什么可隐瞒的。我们与立法者交谈和会面的次数越多,他们对该产品就越满意。事情应该是这样的。