数据

2020-8-6 2:50
在前一节中,我们展示了如何以命令式方式可视化数据。SMILE还支持声明性方法中的数据可视化。使用smile.plot.vega包(在工件smile-scala中),我们可以创建一个规范,将可视化描述为从数据到图形标记(例如,点或条)属性的映射。该规范基于Vega-Lite。Vega-Lite编译器自动生成可视化组件,......
2020-8-5 23:51
拉斯是DocSend的联合创始人兼首席执行官。他之前是Facebook的产品经理,通过收购他的初创公司Pursuit.com来到Facebook,并曾在Dropbox、Greystripe和Trulia担任过职务。跟他来这里:@heddleston和@docsend。 我们一直在跟踪2020 DocSend创业指数中......
2020-8-5 23:46
对于数据工程师来说,这不仅仅是一场反复出现的噩梦--它是日常生活中的现实。十多年来,“数据就是新的石油”这句空话已经过去了,我们仍然在零敲碎打地管理数据,没有适当的系统和控制。数据湖变成了数据海洋,数据仓库变成了…。嗯,不管仓库的大型版本叫什么(我猜是仓库)。数据工程师在现实生活的混乱世界和代码的精确性质之间架起了一......
2020-8-5 13:58
默认情况下,所有响应都是JSON格式。除了JSON,我们还支持XML,很快还支持YAML和CSV。 你可以使用30多种不同的数据模型,比如车辆、Twitter用户和条纹对象。 很快,我们也将支持GraphQL。访问100多个型号,并精确指定您需要的数据。 单击上面的“入门”按钮或访问此处的文档页面。开始只需不到30秒......
2020-8-5 7:50
由于加利福尼亚州的传染病报告系统(加州可报告疾病信息交换系统)存在一个尚未解决的重大问题,圣克拉拉县公共卫生部门以及全州的县公共卫生部门对新冠肺炎检测结果的报告严重不足。国家通知我们,各县收到的检测结果信息不全,这影响了我们发现新的新冠肺炎病例,准确报告我们社区的检测阳性率,以及确定最近几周检测的人数的能力。如果没有......
2020-8-4 6:20
作为世界上最大的互联网平台公司之一,腾讯利用技术丰富用户生活,帮助企业进行数字化升级。一个例子是广受欢迎的微信应用程序,它在全球拥有10多亿活跃用户。平台和内容集团(PCG)负责整合腾讯的互联网、社交和内容平台。盈科推动IP跨平台、多模式开发,总目标是打造更多元化的优质数字内容体验。自成立以来,许多主要产品-从著名的......
2020-8-3 20:18
该项目于去年11月首次宣布,现在该团队发布了一份白皮书,详细介绍了其被称为内容真实性倡议(CAI)的系统将如何工作。除了新的白皮书之外,系统开发的下一步将是实现概念验证,Adobe计划在今年晚些时候为Photoshop做好准备。 TechCrunch与Adobe的CAI总监Andy Parsons谈到了这个项目,该项......
2020-8-3 3:53
关于数据操纵、假新闻以及使用科学作为测谎器的重要性的进化生物学家。 卡尔·伯格斯特罗姆是西雅图华盛顿大学的进化生物学教授。十多年前,他对政府在大流行规划中的作用进行了研究,并对当前的应对措施提出了尖锐的批评。他与同事杰文·D·韦斯特(Jevin D West)合著了一本新书,名为“胡扯:数据驱动世界中的S唯心主义的艺......
2020-8-2 14:16
在我发表了一篇文章,指出大型科技媒体在科技辩论中的多样性是虚伪的,之后,我从几家涵盖的出版物中得到了一些承认。之后,这些记者坐在了一个肯定有新闻价值的故事上。为什么?我不知道。 除了记者们默默地聚集在一起,这篇帖子很受欢迎,但在内心深处,我感觉到人们想要的数据量比我使用的五家大型科技媒体出版物更大。因此,这里有一个更......
2020-8-2 13:0
过去一年,巨型数据泄露的平均成本大幅上升,受此类安全事件影响的企业预计将支付高达3.92亿美元的损失。 如今,数据泄露事件司空见惯,针对公司的网络攻击催生了一个新的网络保险行业,出现了针对未能保护数据的公司的监管和集体诉讼,以及新的法律--如欧盟的GDPR--可以用来对安全松懈的数据控制器施加重罚。 然而,数据泄露事......
2020-8-1 23:27
作为一名拥有15年数字媒体经验的老手,肖恩·克莱顿(Sean Clayton)将品牌与推动增长所需的数据驱动的智能解决方案联系起来。 分拆的理由很明显:品牌希望与与其价值观不符的第三方商业行为保持距离。具体地说,他们对Facebook在执行社区标准方面的“松懈”做法感到失望,就连一些国会议员也称其为“松懈”的做法,允......
2020-8-1 14:1
员工调查平台允许雇主按最有可能成立工会的部门、位置和人口统计数据对员工组进行排序。 今年4月,“商业内幕”(Business Insider)报道称,全食超市(Whole Foods)通过一张基于20多个指标得分的互动热图,密切关注可能成立工会的商店。Vox在6月份关于亚马逊员工的一篇报道也描述了类似的热点图,高管们......
2020-8-1 6:6
在大流行期间,云市场正在形成自己的特色,因为这种新型冠状病毒迫使许多公司加快了向云迁移的计划,即使市场本身已经开始成熟。 根据Synergy Research Group的数据,本周,三大云基础设施供应商-亚马逊、微软和谷歌-都公布了财报,虽然数据显示增长开始放缓,但收入继续以令人印象深刻的速度增长,第一个季度超过3......
2020-7-31 23:48
随着新冠肺炎在美国的住院人数接近疫情迄今的最高水平,在联邦政府本月早些时候突然夺取数据收集控制权后,全国追踪患者和医院资源的努力仍处于混乱状态。 7月10日,特朗普政府向医院和各州发布了一项指令,指示它们停止向美国疾病控制和预防中心(历史上一直处理此类公共卫生数据)提交新冠肺炎医院的日常数据,而是将其提交给卫生与公众......
2020-7-31 22:26
组织:从1996年开始,Alexa Internet一直将他们的爬行数据捐赠给互联网档案馆。这些数据每天都会流入,在禁运期间后会被添加到Wayback Machine中。 从Alexa互联网上抓取EF。这些数据目前不能公开访问。
2020-7-31 22:2
随着新冠肺炎在美国的住院人数接近疫情迄今的最高水平,在联邦政府本月早些时候突然夺取数据收集控制权后,全国追踪患者和医院资源的努力仍处于混乱状态。 7月10日,特朗普政府向医院和各州发布了一项指令,指示它们停止向美国疾病控制和预防中心(历史上一直处理此类公共卫生数据)提交新冠肺炎医院的日常数据,而是将其提交给卫生与公众......
2020-7-31 11:28
组织:从1996年开始,Alexa Internet一直将他们的爬行数据捐赠给互联网档案馆。这些数据每天都会流入,在禁运期间后会被添加到Wayback Machine中。 抓取由Alexa Internet捐赠的数据。这些数据目前不能公开访问。
2020-7-30 23:29
起初,我不确定是否要写这个迁移项目,但当我随机询问人们是否会感兴趣时,回答是压倒性的。这是一个漫长,有点无聊,非常重复,有时令人难以置信的令人沮丧的项目,但我学到了很多,也许其他人也会从这个项目中学到东西。也许有更好的方法来移动这样大量的数据。在我走过的小路上,有大量的杂耍必须发生(我稍后会解释这一点)。谢天谢地,我......
2020-7-30 18:36
斯图尔特·里奇是伦敦国王学院社会、遗传和发育精神病学中心的讲师。他的新书《科幻小说:欺诈、偏见、疏忽和炒作如何破坏对真相的追求》更详细地解释了扎克·韦纳史密斯的这本漫画中的思想,讲述了令人震惊的科学错误和不当行为的故事。它还为如何将科学从目前的困境中拯救出来提出了丰富的想法。 斯图尔特·里奇是伦敦国王学院社会、遗传和......
2020-7-30 5:19
贾亚帕尔的审讯是听证会上为数不多的实质性交流之一,听证会上充斥着令人厌倦的哗众取宠和不知情或不相干的问题。 多年来,亚马逊一直受到有理有据的指控,称其利用其在在线零售领域的鸟瞰地位(其中大部分通过其平台)来发现新产品和类别,并利用这些内幕信息进入这些产品和类别-往往会承担巨额损失,以削弱市场上现有的参与者。 贾亚帕尔......
2020-7-30 0:14
令人惊讶的是,如今我们在线协作是多么容易。我们使用Google Docs进行文档、电子表格和演示文稿的协作;在Figma中,我们一起进行用户界面设计;我们使用Slake与同事交流;我们使用Trello跟踪任务;等等。我们依赖这些和许多其他在线服务,例如做笔记、计划项目或活动、记住联系人以及一大堆商业用途。 我们将这些......
2020-7-29 23:42
许多人认为,要对数十亿条记录进行近乎即时的分析,您需要专用的Linux群集、几个GPU或专有的云产品。我的一些最快的基准测试就是在这样的环境中运行的。但在2020年,使用OmniSciDB(前身为MAPD)的现成MacBook Pro可以愉快地完成这项工作。 在大型企业中,获得新集群的签约并引入专业知识以保持其运营通......
2020-7-29 16:54
嗨,我的名字是Maciej Ceglowski,del.icio.us的最新(希望也是最后一个)所有者。该网站很快就会重新上线。如果您在2010年后将数据存储在del.icio.us上,您将能够将其导出到此处。如果你在2010年之前有这个网站的数据,我现在是否还有数据取决于你是否在2011年完成了选择加入的过程,当时......
2020-7-29 4:50
随着企业容量需求的持续他们势不可挡地崛起为艾字节范围,坚持的问题数据经济增长更快按下。海量数据是开创性的..。 架构旋转瓶颈:每个对存储设备计时和/或互连获得我们就能更快地找到协议和架构需要调整。随着变化的加速,..。 另外还有1,000个机柜添加到设施中,HK4现在有一个总容量为1,500并将进一步添加3000个机......
2020-7-29 3:11
如果您在1997至2005年间使用过计算机,您可能会将有价值的数据刻录到至少一张可刻录CD(CD-R)或DVD-R上。不幸的是,这些书的使用寿命有限,而且很多已经变得无法阅读。这就是为什么在为时已晚之前备份可刻录光盘非常重要-以下是如何做到这一点。 CD-R和DVD-R将数据存储在写入数据时被激光熔化的一层染料上。这......
2020-7-28 22:12
探索,一家位于特拉维夫的初创公司,开发了一个自动化的数据和特征发现平台,今天完成了一轮3100万美元的融资。在注资之前的几个月里,Explorum表现出色,自去年9月以来,该公司的客户群增加了两倍,并纳入了与更多行业和垂直市场相关的数据。 特征工程-使用领域知识通过数据挖掘技术从原始数据中提取特征的过程-是困难的。根......
2020-7-28 17:54
2月18日,科技公司塞伦斯(Cerence)的高管敲响了纳斯达克(Nasdaq)的开盘钟,然后与他们的投资者和来自世界上一些最大的汽车制造商的代表参加了会议。在几个小时的时间里,他们提出了一项旨在帮助公司在五年内收入翻一番的战略:记录世界各地司机的每一个动作、每一个眼神、每一个微笑、每一个皱眉和皱眉-然后出售由此产生......
2020-7-28 2:29
#噪音#污染是城市环境中的主要压力源之一,对人们的生活质量和健康产生负面影响。对于一些市民群体,如学童、患者和老年人,有必要支持他们在城市噪声污染地区寻找步行路线。在一篇新的论文中,我们将重点放在交通噪声的估计上,并提出了一种考虑道路估计噪声水平的提供安静路径服务的方法。 通过结合来自OpenStreetMap(OS......
2020-7-27 16:2
如果你以前在一个组织工作过,那么有100%的机会遇到至少一个人,他说:“我信任数据,我根据数据做出决定。”我个人认识几位来自世界各地的领导人。但如果你仔细想想,你就会意识到,对数据的需求已经从以决策为后盾的数据转变为以数据为后盾的决策。问题已经从“给我看数据来支持我的假设”变成了“给我数据来做决定”。我知道A/B测试......
2020-7-26 23:52
用个人数据换取有用的软件功能并不是什么新鲜事,但我们真的需要在耳机上使用这些功能吗?目前科技界正在进行的最大争论之一是关于隐私的问题。在数据聚合方面有很多钱,虽然像Google这样的公司在展示如何将所有数据投入实际应用(即助手)方面做了很好的工作,但其他公司似乎没有那么有力的理由。 当我最近评论Soul Run Fr......