开源索引

2021-04-02 04:38:58

在两个Sigma Ventures,我们是开源软件的强大信徒。作为两个Sigma的一部分,我们在更广泛的组织中幸运地拥有近1000名软件工程师(200+与计算机科学相关博士),其中许多人在日常工作中积极使用开源软件并贡献回到各种各样的项目。两个西格玛是许多流行开源项目的创造者,包括烧杯和燧石,我们的同事包括一些Apache箭头和熊猫的原始创作者。足以说,我们生活和呼吸开源。

几年来,我们一直在开源软件的兴起,在启动生态系统中,两家Sigma Ventures投资了几家公司,这些公司利用了开放的核心商业模式或发布开源库。这些包括Timescale,NS1,Radar Labs,Gitlab等公司,以及我们最近的投资之一复制。由于各种原因,我们对这些业务感到兴奋。我们已经看到Seplyhand如何由开发人员创建的软件,开发商利用基于社区的发展,可以导致令人难以置信的创新。此外,我们对企业软件在触底采用方面迈出的兴奋,以及开放的核心业务如何导致客户获取和增长显着。

在这种静脉中,我们很高兴能够推出两种Sigma Ventures开源指数,展示我们认为世界上最受欢迎和最快的开放来源项目,您可以在今天第一次全面地看到它。我们希望我们在此处发布的数据将定期更新,将为技术生态系统中的许多不同类型的人提供洞察,从企业家到开发人员,任何有兴趣研究高级趋势的人。最终,我们计划为每个项目添加额外的数据,并允许更粒度的过滤和搜索,并在未来几个月内,我们将发布更多的见解和分析。本着开源运动的精神,如果您有兴趣与您一起玩,我们希望与您分享原始数据。如果您对如何提高指数的建议,请随时伸出援手。最后,如果您正在构建商业开源业务,我们无法兴奋地听到您的故事!

我们首先使用GitHub API下载所有公开的GitHub项目上的所有公开的数据,该项目排名为“观察者”。大多数其他列表,排名开源项目使用星星作为“北极星”度量,没有双关语。然而,我们相信随着时间的推移,GitHub Stars已成为一个往往是一个往往的梳妆台,并且观察者是一个更易于在项目中持续兴趣的信号。当用户选择“观看”GitHub上的项目时,他们会收到有关该项目的通知及其相关讨论。当用户不再对项目感兴趣时,它们通常会不会观看该存储库。因此,我们认为观察者是持续的项目人气的更有趣的信号,而不是星星。此外,使用许可证信息和通过手动排序,我们过滤了非技术项目,例如书籍,列表和教育内容。

我们的索引使用我们称之为“TSV评分”排名项目。该分数是下面列出的变量的加权平均值,我们标准化为适合我们的尺度为0到100.我们选择的权重在括号中列出。

观察者(40%) - 我们用于评估项目人气的主要指标,如上所述,是每个项目的观察者数量。

观察者的增长(25%) - 我们在过去的季度计算了观察者中的三角洲,并相信它为我们提供了一个重要的信号,其中开发人员生态系统的势头。

贡献者(15%) - 贡献者的数量为我们的开发者社区和给定项目的利益提供了意义。

释放节奏(10%) - 我们计算释放节奏随着项目的数量超过其寿命。虽然这可能受到个别贡献者的提交模式的影响,但并没有给我们一个更新的贡献感,我们仍然认为这项指标为我们提供了一个项目演变和增长的节奏的指标。

社区卫生评分(10%) - 最后,我们考虑到GitHub自己的社区健康评分度量,这评估了存储库的保存程度和其文档。

我们了解,这些权重是任意的,并反映一个关于建立一个伟大开源社区的重要性的视角。我们很乐意与您分享原始数据,您可以使用各种权重和其他数据源进行游戏。让我们知道你是否喜欢副本!

虽然我们将在未来几个月内分享更多,但我们的首次迭代指数向我们透露了许多关于今天软件状态的令人欣赏的数据驱动的洞察力。请参阅下面的初始调查结果,我们希望您能够切片和骰子数据并与我们分享任何学习。

百度阿波罗项目是我们的指数增长最快 - 百度,与美国自动车辆空间的同行不同,采取了一种协作和开放的方法来开发他们的自动驾驶汽车,与40家其他公司一起工作并开拓他们的核心技术。 。这一项目的兴趣在过去的季度基本上被挑选,因为他们已收到中国和加利福尼亚州的完全无人驾驶的道路测试批准。

初始化前100名项目的初始启动是由私人,风险投资的初始启动或由原始项目创建者构建的商业实体维护。其中包括前一个类别和汇合(Apache Kafka),Databricks(Apache Spark)和预设(Apache Superset)中的前类别和Confluent(Apache Spark)和预设(Apache Superset)中的Redis,Hashicorp(Terraform),Grafana和Vercel(NextJs)。很高兴看到由科技创业公司领导的开放源创新,我们渴望帮助支持这些公司和其他公司,因为他们继续创新并建立下一代伟大的瓷肿业务。我们想象这一趋势将继续,我们名单上的许多其他项目最终将导致商业实体。

JavaScript的主导地位 - 在过去十年中,JavaScript已成为一个主导的网络技术,在顶级开源项目中显而易见;前100个项目中的32个是用JavaScript编写的,其中包括前10名中的4个。下一个最流行的语言是Java,这是我们名单上的22个项目的基础语言。

技术泰坦是重要的贡献者,特别是谷歌 - 许多大型技术公司创建和维护开源项目,但没有比谷歌更有贡献,这负责第100个项目中的8个(TensoRflow,Flutter,Kubernetes,材料设计,番石榴,角,angularjs和角cli)。下一个最大的贡献者是Microsoft,Microsoft拥有3个项目(vscode,typecript,powertoys),Facebook,其中2个项目(反应,创建 - React-App)和Square,具有2个项目(改造,Okhttp)。

VS代码是最流行的代码编辑器 - VS代码已经显然突出,我们在两个西格玛内部的内部看到了轶事。它是我们索引中第11最受欢迎的开源项目,并且很容易成为软件开发人员中最常用的代码编辑器,他们喜欢其易用性和可定制性。

Kubernetes在这里留下默认的容器编排技术 - 因为计算基础架构移动到集装箱化架构,我们对Kubernetes的承诺感到兴奋,以帮助开发人员构建更可靠和表演云应用程序。 Kubernetes不仅是第5个最流行的项目,它是第三次贡献到项目,有3730个贡献者。这意味着一个高度活跃的开发人员社区,致力于提高核心技术。

数据驱动软件的重要性 - 其中有几个顶级项目,包括我们指数中的#1项目,对建立端到端机器学习和数据科学工作流程至关重要。这包括从算法(Tensorflow,Scikit-Learn,Pandas,Faceswap,Tesseract OCR)到可视化(超级赛,D3,Chartsjs,Echarts,Grafana)的数据基础架构(Spark,Kafka,Redis)的一切。我们一直预测过去十年的数据驱动软件的兴起,并令人兴奋地看到开源社区中反映的这种趋势,因为机器学习和数据科学技术成为民主化。

这篇文章和开源指数不是由两个ΣVentures的认可,其中列出的项目LP,其内容或创造者或任何讨论的任何公司。此处表达的意见仅仅是提交人的意见,截至最初发布的日期,并不一定是两个ΣVentures,LP或其任何附属公司的意见。他们不打算提供,不应依赖投资建议。两个Sigma Ventures对非现场页面的内容或链接或链接到本网站的任何其他网站不负责。您的链接或使用任何第三方网站是您自己的风险。两个Sigma Ventures对所提供的产品或服务或任何第三方网站所列的信息不承担任何责任。

如果您的公司正在推动行业的界限 - 特别是因为它涉及利用数据科学,机器学习,分布式计算,先进的硬件或软件或人工智能 - 我们希望收到您的界限。

联系我们