#数据

2021-3-2 7:18
极右翼社交媒体平台Gab的创始人说,前总统唐纳德·特朗普的私人帐户是最近入侵该网站的黑客窃取并公开发布的数据之一。 在周日的一份声明中,创始人安德鲁·托尔巴(Andrew Torba)使用憎恶性的言论来指称“分布式否认秘密”的共同创始人艾玛·贝斯特(Emma Best)。该声明证实了WikiLeaks风格的组织在周......
2021-3-2 4:7
管理数据非常困难。管理数据管道更加困难。跨组织转换时,数据仓库中各个表或值的含义会​​丢失。另一个团队的重构破坏了您团队的工作流程。而且,通常很难说出谁进行了更改以及何时进行了更改。 数据构建工具dbt通过接管ETL管道中的转换步骤来减轻这些挫败感。 dbt本身不是数据处理器,而是位于包含已提取和加载的数据的数据仓......
2021-3-2 1:8
该公司之前走过债务之路— 2017年进行的F轮融资将1.15亿美元的资金与2500万美元的债务合并在一起。美国银行证券担任新融资的牵头安排人和账簿管理人,巴克莱,瑞士信贷和摩根士丹利高级基金也参与其中。 “在这一回合中,我们既可以为债务再融资,又可以为当前业务和未来计划增加大量能力,”斯坦伯格(Zeta的首席执行官......
Intro to Bias in AI(beluis3d.medium.com)
2021-3-1 14:21
要了解AI偏差,我们需要了解数据集偏差。收集,标记和组织数据是耗时且昂贵的工作。人工智能界中许多流行的数据集可能需要花费数年的时间来制作和发布。此工作需要大量资源,并且不会使数据集创建成为一项小规模或高效的任务。由于创建具有所有可能排列和域的数据集是不切实际的,因此所有数据集都存在某种形式的偏差。数据的这种限制会导致......
2021-3-1 0:35
正如我们在随附文章中所描述的那样,此数据存在重大问题。这是对我们从2010-19年度因警察不当行为而支付的定居点支付的金额(或其他规定的范围)的最佳猜测,但是不同的城市有不同的收集,存储和分类定居点的方式。因此,不应在城市之间比较此数据。我们无法知道(或检查)该覆盖范围不当的行为在各个城市之间是否具有可比性。 (例如......
2021-2-28 23:39
当您需要使用大量数据扩展应用程序时,如何决定存储解决方案?您如何既可以安全地存储大型数据集又可以与之有效交互?这通常会引发关于是否使用SQL或NoSQL的争论。每个都有优点和缺点。 消费者可能不需要每隔几分钟就更新一次。在这种情况下,能够将数据集加载到内存中可以极大地加快访问速度并实现巨大规模。这就是为什么对于I......
2021-2-28 12:39
Android手机应用程序可创建伪造的联系人,这些联系人将与您的真实联系人一起存储在您的智能手机中。这会将伪造的数据提供给正在复制我们的私人数据以使用或出售的任何应用程序或公司。这称为“数据中毒”。 这些虚假联系人不会影响您对手机或真实联系人的正常使用。 用户可以设置虚假联系人的姓氏和名字列表,以及它们的电话号......
2021-2-28 12:2
©2020财富媒体IP有限公司。 版权所有。 使用本网站即表示接受我们的使用条款和隐私政策| 收集时的CA通知和隐私声明|| 不要出售我的个人信息|| Ad Choices FORTUNE是Fortune Media IP Limited的商标,已在美国和其他国家/地区注册。 《财富》杂志可能会因本网站上的某些产品和......
Atlassian Acquires Chartio(www.atlassian.com)
2021-2-27 9:4
我们很高兴地宣布,Atlassian已收购了位于旧金山和弗吉尼亚州布莱克斯堡的基于云的可视化和分析解决方案Chartio。我们很高兴Chartio帮助我们在Atlassian产品中提供数据可视化。 Atlassian产品是数据宝库的所在地,我们的目标是释放这些数据的力量,使我们的客户可以超越现成的报告,并真正自定义......
2021-2-27 8:40
该公司计划从Jira开始在整个平台中整合Chartio技术。在被收购之前,Chartio已产生了自己的数据份额,据报告,有280,000个用户已经为从100,000多个数据源中提取的540,000个仪表盘创建了1,050万个图表。 Atlassian将Chartio视为将数据可视化组件引入平台并真正利用锁定在其产品......
2021-2-26 11:5
长期以来,Android一直提供活动识别API,该活动识别以电池高效的方式通过机器学习模型处理设备传感器数据。 Google现在提供了Android Sleep API,以允许创建更多的健康应用程序。 我们所做的很多事情都取决于晚安。我们的电话已成为做出更明智的睡眠决定的绝佳工具。而且,通过了解睡眠习惯,人们可以......
2021-2-26 8:38
好吧,自我开始草稿已经一年了,所以我想是时候发布这份草案了! :) 这是我的个人数据解放基础结构的地图,其中包含所使用的脚本和工具的链接; 和我的博客文章详细介绍了它的不同部分。 我的数据解放目标是近似“个人数据镜像”。 通常,尽管不同平台的互操作性很差(或缺乏互操作性)。 为我的博客文章提供更多有关数据解放及......
2021-2-25 21:12
在COVID-19大流行期间,大规模转向在线购物意味着零售商需要快速分析客户数据,才能与亚马逊等竞争对手竞争。 Lexer是一个总部位于澳大利亚墨尔本的客户数据平台,它通过在一个平台上组织数据来帮助品牌管理数据,从而使中小型品牌的分析变得更加容易。该公司今天宣布,它已经筹集了2550万美元的B系列资金,用于在澳大利亚......
2021-2-25 4:45
作为从事数据工作长达13年之久的人,我亲眼目睹了“数据驱动”趋势的崛起。在开始销售第一家数据初创公司之前,我花了一些时间在统计分析师中,用R建立销售预测模型,一名软件工程师创建数据转换作业,以及一名产品经理运行A / B测试并分析用户行为。所有这些角色的共同之处在于,他们使我了解到数据的上下文(它代表什么,如何生成,......
2021-2-25 2:17
Katana Graph是一个帮助企业分析和管理规模非结构化数据的启动,今天宣布了英特尔资本领导的2850万美元。 Katana图表是由德克萨斯大学奥斯汀计算机科学教授Keshav Pingali和助理教授Chris Rossbach教授。 CEO Pingali在手机面试中告诉业务将企业摄取大量数据进入记忆力。 ......
2021-2-25 1:3
翼风险资本带领圆形的AV8 Ventures,俄勒冈风险基金和硅谷数据资本的帮助。 公司首席执行官和联合创始人Marty Kagan指出,在他以前的角色中,他看到了在对公司各个地区有价值的日志,指标和痕迹中有大量数据的组织,但大多数组织都无法承担高成本由于涉及令人难以置信的数据量,维护这些记录很长。他开始了水解,因......
2021-2-25 1:0
今天,在一个现代化的,数据密集型组织中,“ SELECT *”将杀死您。有了PB级的信息,成千上万个表(在另一面!)以及数据库服务器上引发了数百万甚至数十亿个调用,数据科学团队将不再只是索要所有数据并立即开始使用它。 大数据导致了数据仓库和数据湖(以及显然是数据湖的房屋),使访问数据更加健壮和轻松的基础架构的兴起。......
2021-2-24 23:46
如果您依靠Apple和Google的App Store规则,以便将您的位置数据安全地销售给政府的公司,您可能希望重新思考该政策。但是,如果你依靠法律制度阻止政府机构购买该数据,你可能会幸运 - 也许。 新的财政部检查员总报告称,它不相信机构有权购买商业服务的位置数据而不获得逮捕令。看门狗一直在调查内部收入服务(IR......
2021-2-24 22:59
然而,有些人认为,“云”,单数,可能是一个错误数:通常这些工具彼此不合适,有效地作为单独的软件运行。今天,一个名为blueshift的初创公司 - 声称提供端到端的营销堆栈,通过从地上建造它来包括传统的营销数据以及客户体验 - 正在宣布一些资金,指出建立机会的资金更高效的替代品。 启动已经关闭了一轮3000万美元,......
2021-2-24 21:27
这篇博客文章代表了几个月的工作和超过400个小时的实际基准测试,我们将Redpanda和最新的2.7 Kafka版本进行了比较。我们使用了Confluent在CNCF开放式消息传递基准测试中的推荐的生产设置和环境。 在开始之前,完整的实际结果以及完整的工作负载分布,饱和度,延迟和吞吐量位于此交互式博客文章的底部。 ......
Decoding Mars 2020(destevez.net)
2021-2-19 13:57
美国国家航空航天局(NASA)对火星的最新飞行任务“火星2020”于几周前发射升空。但是,由于所有Tianwen-1的工作正在进行中,到目前为止,我还没有时间专门为该任务指定一个帖子(尽管我在Twitter上有偷看的机会)。该任务由流动站和直升机组成(这是太空探索的真正新颖之处)。两者都是在巡航阶段以及进入,下降和着......
2021-2-19 0:50
当我们第一次遇到鲍里斯时,他遇到了一个看似简单的问题。假设您在Figma的销售团队中工作,并且客户的帐户即将更新。进行对话时,您可能想知道一些事实:他们的团队中有多少人正在使用Figma,他们创建和共享了多少文件?您的帐户拥护者和超级用户是谁? 但是鲍里斯(Boris)知道要找到这些答案并不容易。销售团队在CRM工......
2021-2-19 0:13
在Humio中,CrowdStrike成立了一家公司,该公司将为其提供收集无限日志记录信息的能力。大多数公司必须选择要记录的内容以及保留多长时间,但是有了Humio,他们不必每天选择处理多个TB数据的客户来做出这些选择。 Humio首席执行官Geeta Schmidt在公司博客中写道,该交易以类似于Scalyr的术......
2021-2-19 0:13
该公司是建立在数据仓库之上的新兴公司的一部分。人口普查背后的总体思路是帮助企业运营其数据仓库中的数据,传统上仅用于分析和报告用例。但是,随着企业意识到他们所需的所有数据已经​​在其数据仓库中可用,并且他们可以将其用作单个事实来源,而无需构建其他集成,因此开始形成可操作该数据的公司生态系统。 该公司认为,现代数据堆......
2021-2-18 20:4
首席战略官马克·费伦蒂诺(Marc Ferrentino)告诉我:“如果我们提供[响应搜索查询的链接],则我们认为这是一个失败。“ 费伦蒂诺(Ferrentino)说,从3月17日开始,随着搜索算法“猎户座”更新的发布,该公司将能够做得更好。 然后,Yext将能够直接从企业网站上非结构化页面中提取答案。他说,关......
2021-2-18 13:6
到目前为止,Glassdoor仅列出了特定公司的总体排名,因此无法轻松确定例如黑人女性是否与白人男性相同,或者拉丁美洲裔男性是否与亚洲男性相似。除了种族之外,Glassdoor现在还允许人们按性别身份,父母或照料者身份,残疾,性取向和退伍军人身份进行过滤。 总体而言,根据Glassdoor的最新初步研究,与所有员工......
2021-2-18 12:25
跳过站点导航近一年来,每天都有成百上千的来自各行各业的COVID跟踪项目贡献者来汇编,发布和解释至关重要的COVID-19数据,以为他们的美国人提供服务。在公司成立1周年3月7日,我们将发布最终的每日更新,并且我们的数据编辑将停止。文档,分析和归档工作将继续进行两个月,我们将在5月结束该项目。 从一开始,这种选择的......
2021-2-18 9:35
Warning: Can only detect less than 5000 characters
2021-2-18 4:57
(彭博社)-1月28日,即GameStop Corp.疯狂收购记录的短暂推动之后,其疯狂飙升的第二天,大约价值3.59亿美元的股票陷入了困境,超过100万股被视为根据美国证券交易委员会(SEC)的数据,由于买方缺乏现金来完成购买交易或卖方没有股票来进行交易,这一天未能交付.SEC报告涵盖了从1月15日到年底的交易。本......
2021-2-17 21:7
TigerGraph创始人兼首席执行官Yu Xu表示:“ TigerGraph在通过可扩展的本机图形技术与预连接实体进行连接和分析数据方面,与传统的将大型表与行和列联接在一起的方法相比,正在引领着范式转变。” “这笔资金将使我们能够扩展产品范围,并将其推向更多市场,使更多的客户能够实现图分析和AI的优势。” Tig......