2020年透明度报告

2021-02-26 02:37:39

在GitHub,我们将开发人员放在首位,并且我们努力为代码协作提供一个安全,开放和包容的平台。这意味着我们致力于最小化软件项目的破坏,保护开发人员的隐私,并在内容审核和用户信息披露方面与开发人员保持透明。这种透明性至关重要,因为它可能会影响人们的隐私权,信息的获取以及对影响其内容的决策提出异议的能力。考虑到这一点,我们发布了可追溯到六年(2019年,2018年,2017年,2016年,2015年和2014年)的透明度报告,以告知开发人员社区GitHub的内容审核和用户信息公开的信息。

联合国有关内容审查的报告建议,在线平台应通过(1)对内容删除政策保持透明,并(2)尽可能地限制内容来促进言论自由和信息获取。在GitHub,我们都做到了。查看我们对联合国专家报告的贡献,以了解更多详细信息。

通过公开采购来公开制定我们的政策,以便我们的用户可以提供意见并跟踪更改

公开发布所有《数字千年版权法案》(DMCA)和我们在公共存储库中实时处理的政府删除要求

根据国际人权法,将我们的可接受使用政策与言论自由的限制,例如仇恨言论的限制保持一致

我们认为有可能为用户提供补救或删除特定内容的机会,而不是阻止整个存储库

仅在非法(地理封锁)的司法管辖区限制对内容的访问,而不是对全球所有用户都将其删除

在根据涉嫌违反版权控制的规定删除内容(根据美国DMCA的1201节或其他国家的类似法律)之前,我们会仔细审查法律和技术要求,并为用户提供选择由GitHub资助的独立法律建议的选项。

2020年,包括全球大流行和对种族不平等和社会正义的日益关注在内的当前事件影响了GitHub上的政策和行为。一些著名的例子:

我们看到平台上仇恨言论和歧视性内容的报道有所增加,其中包括与诸如Black Lives Matter之类的运动直接相关,以及美国的政治气氛以及对GitHub存储库默认分支的更名。

由于预期美国和其他地区将于2020年举行大选以及COVID-19的发布,我们在可接受使用政策中对错误信息和虚假信息进行了新的限制。此限制使我们能够更好地采取行动,以对平台上的虚假,不准确或故意欺骗性信息采取行动,这些信息可能会对公共利益(包括健康,安全,选举诚信和公民参与)产生不利影响。考虑到平台上内容的性质,在极少数情况下我们确实有可能采取行动,我们通常只需要澄清一下,而无需删除内容。虽然我们在极少数情况下使用此术语,但在某些情况下我们确实与存储库所有者联系,要求他们添加免责声明或以其他方式弄清信息源,例如,有关自己动手呼吸器的信息。

Hacktoberfest是一项旨在鼓励人们练习为开源项目做贡献的活动,今年尤为引人注目,这是由于第三方视频一开始导致报告(尤其是垃圾邮件)大量增加,并破坏了他人在GitHub上的体验十月

在今年的基于数字的报告中,GitHub继续关注开发人员和公众的强烈兴趣,例如我们从政府收到的请求(无论是关于用户的信息还是要删除用户发布的内容)以及版权相关的下架。与版权相关的删除(我们通常称为DMCA删除)与GitHub特别相关,因为我们用户的大部分内容都是软件代码,并且有资格获得版权保护。也就是说,GitHub上的一小部分内容是DMCA通知的主题(万分之二的存储库中有不到两个)。内容删除的上诉是开发人员和公众都感兴趣的另一个领域。

今年,我们通过在许多新领域中添加报告来提高透明度:

对于合法的用户信息请求,我们在披露信息时按请求类型进行细分(以前,我们仅针对收到的请求进行报告)

与违反我们的服务条款一部分的违反我们的可接受使用政策有关的帐户和内容恢复,包括由于上诉而引起的(虽然我们的DMCA编号始终以反通知的形式包含上诉,但今年的报告适用于其他违规行为)

因贸易制裁法而对帐户限制提出上诉。这是2020年的一个全新类别,我们预计在1月份宣布为伊朗的开发商提供我们的服务的新许可证后,到2021年将下降,这是全球代码协作的重大胜利。

总而言之,在今年的透明度报告中,我们将审查2020年的统计数据:

继续阅读以获取更多详细信息。如果您不熟悉本报告中使用的任何GitHub术语,请参阅GitHub词汇表。

GitHub的《用户数据法律要求指南》解释了我们如何处理经法律授权的请求,包括执法请求,传票,法院命令和搜查令,以及国家安全信函和命令。我们遵守法律,并且还要求用户遵守数据的最高法律标准。

某些类型的合法授权的用户数据请求(通常在范围上受限制)不需要法官或裁判官进行审查。例如,传票和国家安全信函都是书面命令,可以强迫某人出示文件或就特定主题作证,而且都不需要司法审查。国家安全信件受到进一步限制,因为它们只能用于国家安全事务。

相比之下,搜查令和法院命令都需要司法审查。国家安全命令是一种可以发布的法院命令,例如用于产生信息或授权监视的命令。国家安全命令由外国情报监视法院(美国专门负责国家安全事务的法院)发布。

我们仅在满足适当的法律要求时,或在我们认为有必要遵守我们的法律要求或防止发生涉及人员死亡或严重人身伤害的紧急情况时,才将信息发布给第三方。

我们要求传票公开某些类型的用户信息,例如姓名,电子邮件地址或与帐户相关联的IP地址,除非在极少数情况下我们确定必须进行公开(尽可能限制)以防止涉及死亡或严重人身伤害的紧急情况。

对于所有其他类型的用户信息,例如用户访问日志或私有存储库的内容,我们需要法院命令或搜查令。

我们会通知所有受影响的用户有关其帐户信息的任何请求,除非法律或法院命令禁止这样做。

2020年,GitHub收到303个公开用户信息的请求,而2019年为261个。在303个请求中,我们处理了155个传票(134个刑事和21个民事),117个法院命令和23个搜查令。这些请求还包括8个跨境数据请求,我们将在本报告的后面部分分享更多信息。这些请求中的绝大多数(93.1%)来自执法部门。其余的6.9%是民事请求,所有这些请求均来自希望获得有关另一方信息的民事诉讼人。

这些数字代表了我们收到的每一个关于用户信息的请求,无论我们是否公开信息,都有一个例外:我们甚至被禁止陈述我们收到了多少个国家安全信件或命令。有关以下内容的更多信息。我们将在下一部分中介绍有关披露和通知的其他信息。

我们会仔细审查所有公开用户数据的要求,以确保他们遵守我们的政策并满足所有适当的法律要求,然后将其推迟到不符合要求的地方。因此,我们没有针对收到的每个请求公开用户信息。在某些情况下,请求不够具体,在我们要求澄清后,请求方撤回了请求。在其他情况下,我们收到了非常广泛的要求,并且我们能够限制所提供信息的范围。

当我们确实披露信息时,除非响应搜查令,否则我们绝不会共享私人内容数据。内容数据包括例如托管在私有存储库中的内容。对于所有其他请求,我们仅共享非内容数据,其中包括基本帐户信息(例如用户名和电子邮件地址),元数据(例如有关帐户使用或权限的信息)以及有关帐户活动或访问历史记录的日志数据。

在2020年处理的303个请求中,我们针对其中206个披露了信息。我们披露了有关133条传票(120条刑事和13条民事),52条法院命令和21条搜查令的信息。

这206项披露影响了11,909个账户。在这些受影响的帐户中,有十二个请求占11,309个请求。仅三个请求就影响了9,000多个帐户,其中一个请求影响了6,000多个帐户。不计算这12个请求,剩下的291次我们披露信息影响了600个帐户,平均每个披露大约两个帐户。

当法院命令寻求有关访问在GitHub上发布的内容或共享IP地址的信息,而不是针对特定用户时,通常会发生影响大量用户的请求。在这些情况下,GitHub会尽力减少日志数据中标识的用户共享的信息。例如,当满足要求时,GitHub会经常尝试通过散列数据来避免产生任何个人信息。如果法律要求在日志数据中生成用户名和IP地址,则GitHub通常会将我们共享的有关用户帐户的个人信息限制为日志条目中有关从特定IP地址或特定URL访问的数据。此数据可能包括用户名,IP地址,用户代理字符串,URL路径和引荐来源网址。为了我们的报告目的,我们指的是这些较大的日志披露,我们将共享“特定用户在特定时间从特定IP地址访问特定URL”作为“受到最小影响”的用户帐户。这是因为对于我们认为“受最小影响”的帐户,我们并未生成有关该特定用户的一般帐户信息,例如其电子邮件地址或其他联系信息,有关其帐户内容,组织成员身份或他们在浏览器外部的浏览历史记录的信息。捕获的特定日志条目。

当我们根据法律要求披露用户信息时,我们会通知用户,除非法律或法院命令阻止我们这样做。在许多情况下,法律要求都伴随有法院命令,该命令使我们无法通知用户,通常称为堵截令。

在2020年我们公开信息的206次中,我们只能通知用户14次,因为堵头令伴随着其他192个请求。

带有堵截令的请求数量在总体请求中所占百分比继续呈上升趋势,但与我们处理的刑事请求数量相关。刑事事务中的法律要求通常带有堵截令,因为执法部门经常断言通知会干扰调查。另一方面,民事事项通常是公共记录,法律程序的目标通常是诉讼的当事方,从而避免了任何保密的需要。我们今年处理的所有民事请求都没有附带堵嘴令,这意味着我们已通知了每个受影响的用户。

在2020年,我们继续看到我们处理的民事请求(6.9%)与通知用户的能力(6.8%)之间存在相关性。我们过去几年的数据还反映了通知百分比与民事请求百分比相关的趋势:

我们在法律上可披露的有关国家安全信函和《外国情报监视法》(FISA)指令的信息非常有限。美国司法部(DOJ)已发布准则,仅允许我们报告有关此类请求的信息,范围从250开始,范围从零开始。如下所示,我们在2019年收到了0–249个通知,影响了0–249个帐户。

美国以外的政府可以通过司法协助条约(MLAT)或类似形式的国际法律程序,通过司法部对用户信息进行跨境数据请求。我们的《用户数据法律要求指南》解释了我们如何处理来自外国执法机构的用户信息请求。本质上,当外国政府从GitHub查找用户信息时,我们会将政府定向到DOJ,以便DOJ可以确定请求是否符合美国法律保护。

如果确实如此,美国司法部会向我们发送传票,法院命令或搜查令,然后我们将像美国政府收到的任何其他请求一样进行处理。当我们收到美国司法部的这些要求时,它们不一定带有足够的背景信息,我们无法知道它们是否来自另一个国家。但是,当他们确实指出这一点时,我们会在传票,法院命令和搜查令的统计信息中捕获该信息。今年,我们知道我们处理的其中两个法院命令源自跨国界请求。

2020年,我们直接收到了来自外国政府的八项要求。这些请求来自两个国家,德国和印度。这类似于2019年,当时我们也收到了来自德国和印度的八项要求。根据上述准则,在每种情况下,我们都将这些政府移交给司法部以使用MLAT流程。

在下一部分中,我们描述了我们收到的删除或阻止用户内容的两大类请求:政府移除请求和DMCA移除通知。

GitHub有时会收到政府的要求,要求删除他们认为在其当地管辖范围内属于非法的内容。当我们应政府的要求删除内容时,我们会尽可能地将其限制为内容非法的司法管辖区(并非在所有地方)。此外,我们总是将导致该阻止的正式请求发布到公共政府拆除仓库中,创建一个公共记录,使人们可以看到政府要求GitHub拆除内容。

如果我们认为对这三个问题的回答都是“是”,则我们将以最窄的方式封锁内容,例如,仅在当地管辖范围内对内容进行地理封锁。

2020年,GitHub根据当地法律收到并处理了44项来自俄罗斯的政府拆除请求。这些删除导致在俄罗斯封锁了44个项目(36个要点,五个存储库的全部或一部分以及三个GitHub Pages站点)。相比之下,在2019年,我们处理了16项下架事件,影响了54个项目。尽管我们在2020年处理了更多的政府拆除请求,但总体上受影响的项目数量减少了。

除了基于违反当地法律的请求外,GitHub还处理了13项来自政府的请求,要求将其内容作为违反服务条款的内容予以删除,到2020年影响到12个帐户和一个存储库。这些请求涉及网络钓鱼(尼泊尔,美国和斯里兰卡) ,恶意软件(西班牙),虚假信息(乌拉圭)或与其他产品条款(英国和中国)相关的违规行为。

由于缺乏证据表明发生了违反我们服务条款的行为,我们拒绝了三项政府要求违反服务条款的要求。这些请求来自丹麦,韩国和美国。我们还收到了印度的一项要求,其中内容所有者在我们处理通知之前已将其删除。

与我们全面进行内容审核的方法一致,GitHub处理DMCA声明以最大程度地保护开发人员,并且在设计DMCA时应考虑到开发人员的删除政策。我们收到的大多数内容删除请求都是根据DMCA提交的,它允许版权所有者要求GitHub删除他们认为侵犯其版权的内容。如果发布涉嫌侵权内容的用户认为删除是一个错误或错误标识,那么他们可以发送反通知,要求GitHub恢复该内容。

此外,在处理有效的移除通知之前,该通知声称只有一部分存储库受到侵权,或者,如果是这种情况,我们将为用户提供一个机会来首先解决通知中指出的索赔。现在,我们还会通过所有有效的声明来声明这样做,这些声明都表明您在规避技术保护措施。这样,如果用户删除或修复通知中标识的特定内容,我们将避免完全禁用任何内容。鉴于有多少用户在彼此的项目中依赖彼此的代码,因此这是我们DMCA政策的重要组成部分。

每次我们收到有效的DMCA删除通知时,我们都会对个人信息以及无法确定是否存在违规行为的所有报告的URL进行编辑。然后,我们将通知发布到公共DMCA存储库中。

我们的《数字千年版权法案(DMCA)删除政策》详细说明了DMCA流程,以及删除通知和反通知之间的区别。它还规定了提出有效请求的要求,其中包括提交通知的人应考虑合理使用。

2020年,GitHub收到并处理了2,097个有效的DMCA移除通知。这是我们删除内容或要求我们的用户删除内容的单独通知的数量。此外,到2020年,我们收到并处理了32份有效的抗辩通知,两份撤回,三份撤销,一份抗辩通知撤销和一份抗辩通知撤销。在2020年,我们总共收到了2136份通知。 DMCA移除要求。

虽然可以删除内容,但也可以将其还原。在某些情况下,如果收到以下情况之一,我们将恢复已删除的内容:

反对通知:被删除内容的人向我们发送了足够的信息,声称删除是由于错误或误认导致的。

撤消:提起诉讼的人改变了主意,并要求撤回诉讼。

撤销:在收到看似完整的删除请求后,GitHub稍后收到使该请求无效的信息,我们撤销了最初的决定以履行删除通知。

这些“撤回”和“撤消”的定义均指代下架请求。 但是,就抗辩通知而言,同样可能发生。 2020年,我们处理了一份抗辩通知撤回和一项抗辩通知撤消。 2020年,移除通知的总数为每月125到232条。 反通知,撤回和撤消的每月总数从1到8不等。 通常,单个删除通知可以包含多个项目。 对于这些情况,我们查看了由于2020年DMCA移除要求而被撤消的项目总数,包括存储库,要点和GitHub Pages站点。 ......