数据

2020-8-27 18:12
你很有可能在过去的几个月里从亚马逊上买了东西(是的,我们都是伪君子,而且现在正在流行)。尝试在您的电子邮件中搜索其中一个订单。对我来说,那应该是“猫瓣”、“辣椒油”或“空气漂浮”。 没有运气吗?你并不孤单:亚马逊在几个月前就不再在订单确认和发货通知电子邮件中包含商品详细信息。他们现在只显示价格和订单日期。尽管亚马逊有......
2020-8-27 11:56
在现代世界做生意可以被认为是一种背信弃义的追求。一方面,你有一个越来越有洞察力的潜在消费者基础,不断要求更多和更好的东西,另一方面,你必须不断地跳出框框,不断创新,在大多数情况下部署技术,以可持续的、有希望的、长期盈利的方式体现这一价值。 无论是在生产还是销售周期,信息一直是并将继续是获得竞争优势的地方。因此,只要说......
2020-8-27 2:39
TL;DR:基于我们在神经语义解析方面的最新研究,我们介绍了Photon,这是一个针对数据库的自然语言接口的现场演示。Https://naturalsql.com/🔗。 最近,该领域对基于自然语言的数据查询方法的兴趣激增。这在一定程度上是由自然语言处理的最新进展推动的,这些进步导致了基于语音和文本的界面在广泛的应用中......
2020-8-27 2:33
为了在整个组织中扩展数据的使用,有许多与发现、治理和集成相关的挑战需要解决。这些解决方案的关键是强大而灵活的元数据管理系统。LinkedIn在最易维护和可伸缩的元数据方法上经历了几次迭代,导致他们目前在DataHub方面的工作。在本期节目中,马尔斯·兰和帕德胡·冈南解释了他们是如何设计这个平台的,它是如何集成到他们的......
2020-8-26 18:38
梁@ryancharmes和我刚刚完成了我们的书的初稿-OCaml科学计算!您可以在这里阅读草稿:https://lnkd.in/dSE6hEg这本书是对我们长期致力于函数式编程和数值计算的总结。而由于各种强大的框架和工具包的快速发展,数据科学、ML和AI的进入门槛变得越来越低。该工具本身仍然是一个黑匣子,对现实中的......
2020-8-26 13:26
最近,我偶然看到Reddit上有一条关于数据科学和机器学习中不同角色的帖子,比如数据科学家、决策科学家、产品数据科学家、数据工程师、机器学习工程师、机器学习工具工程师、AI架构师等。 我觉得这令人担忧。当数据科学过程(问题框架、数据工程、ML、部署/维护)分散在不同的人之间时,很难有效。这会导致协调开销,分散责任,缺......
2020-8-26 13:26
今天我想谈谈故事因素:通过讲故事的艺术和讲个人故事的力量来激励、影响和劝说。 我们即将创建一个新的播客,与我们服务的学生分享我们获得的知识和机会。 我希望我们可以在营销会议期间通读一下这篇博客,然后花5分钟时间进行讨论。我会把这篇帖子写得尽可能短,这样我们见面时就有时间讨论了。 我们从故事中学到了一切。我女儿痴迷于杰......
2020-8-26 13:22
众所周知,加速数据处理任务的方法之一是将数据划分为小块,然后并行处理这些块。让我们假设我们可以很容易地对任务进行分区,或者输入数据已经被分区为单独的文件,这些文件都驻留在单个存储设备上。我们还假设我们在这些数据上运行的算法足够简单,这样计算时间就不会成为瓶颈。通过并行读取文件可以获得多少性能?我们能丢一些吗? 在开发......
2020-8-26 12:40
根据Motherboard最先报道的公共采购记录,海关和边境巡逻队在8月份与Venntel签署了一份价值47.6万美元的合同,Venntel是一家有争议的公司,收集并出售人们的电话位置数据。 Venntel销售一款软件产品,可以收集从人们下载的智能手机应用程序中收集的位置数据。手机位置数据是一种很有价值的监视工具--......
2020-8-26 12:15
对于这篇文章,我将把人工智能(AGI)带到一个几乎所有(95%+)经济价值工作都能与人类匹敌或超过人类的人工智能系统。我更喜欢这个定义,因为它关注的是什么导致了最大的社会变革,而不是我们如何做到这一点。 我保持90%的额度不变,但把其他的都改得更快。现在,如果你想找一个论据来解释为什么我选择了这些特定的年份,为什么我......
2020-8-25 21:20
下载PDF摘要:数据是计算的瓶颈。大量的应用数据压倒了我们今天设计的现代机器的存储能力、通信能力和计算能力。因此,许多关键应用程序的性能、效率和可扩展性都受到数据移动的瓶颈。在这次主题演讲中,我们从1)处理数据,2)利用海量数据,以及3)利用应用程序数据的不同语义属性方面描述了现代体系结构的三个主要缺点。我们认为,智......
2020-8-24 17:27
2019年7月,警方赶到32岁的席尔维亚·加尔瓦的家中。加尔瓦的朋友也在家里,拨打了911,声称她无意中听到加尔瓦和她43岁的男友亚当·克雷斯波之间的激烈争吵。两人一起住在佛罗里达州的哈兰代尔海滩,距离迈阿密约20英里。 当警察赶到时,加尔瓦已经死亡,她的胸部被床柱尖端的12英寸刀片刺穿。警方认为克雷斯波试图把加尔瓦......
2020-8-24 16:16
2019年7月,警方赶到32岁的席尔维亚·加尔瓦的家中。加尔瓦的朋友也在家里,拨打了911,声称她无意中听到加尔瓦和她43岁的男友亚当·克雷斯波之间的激烈争吵。两人一起住在佛罗里达州的哈兰代尔海滩,距离迈阿密约20英里。 当警察赶到时,加尔瓦已经死亡,她的胸部被床柱尖端的12英寸刀片刺穿。警方认为克雷斯波试图把加尔瓦......
2020-8-24 5:40
微软飞行模拟器玩家本周在澳大利亚发现了一个巨大的高山方尖碑。虽然飞行模拟器在重现真实世界方面做得很好,但这个异常巨大的结构在现实生活中并不存在。玩家现在已经发现,它的存在源于一个简单的打字错误。 大学生内森·赖特(Nathan Wright)去年编辑了OpenStreetMap数据,作为他学位工作的一部分,在一座实际......
2020-8-23 20:15
在大流行的早期,接触者追踪这个术语突然进入公众意识:这是一种鞋-皮革和劳动密集型过程,熟练的卫生专家通过这个过程与感染者建立个人融洽关系,以确定他们与谁有过接触。1/。 既有好的原因(大流行的规模),也有坏的原因(科技的认识论盲目,坚持认为所有的社会因素都可以被忽略,而倾向于量化的因素),人们对自动化这一过程感兴趣,......
2020-8-23 2:45
在许多科学计算和工业应用中,存储和处理大量数据是一个挑战。其中一个标准数据模型是HDF5,这是一种开放技术,它实现了分层结构(类似于文件系统结构),用于在单个文件中存储大量可能异构的数据。HDF5文件中的数据被组织成组和数据集;您可以将它们分别视为本地文件系统中的文件夹和文件。您还可以选择将与每个项目相关联的元数据存......
2020-8-21 10:24
一次数据库泄露暴露了TikTok、Instagram和YouTube近2.35亿用户的个人资料数据。 这些数据似乎是通过一种称为网络抓取的做法收集的,即一家公司访问服务的Web界面,然后自动整理数据…。 这与黑客攻击不同,因为它涉及为了访问不应该公开访问的数据而闯入系统。网络抓取只访问公共数据。 例如,自动化系统可以......
2020-8-21 0:49
比较技术公司的安全研究团队今天披露了一个不安全的数据库如何导致近2.35亿Instagram、TikTok和YouTube用户档案在网上暴露,这只能被描述为大规模的数据泄露。 最近,出现在暗网网络犯罪论坛上的关于账户数据的报道接二连三。从黑暗网络审计显示目前10万次入侵中有150亿个登录被盗,到黑客免费提供3.86亿......
2020-8-20 12:33
为了减少延迟和提高整体处理性能,Cloudlet(或称迷你云)正开始在更靠近数据源的位置推出。但随着这种方法的发展,它也带来了一些涉及数据分发、存储和安全的新挑战。 分布式云的日益流行是对云模型有局限性的认识。将不断增长的终端设备数据发送到云进行处理既耗费资源,又耗时,而且效率极低。 Cadence首席执行官谭立布(......
2020-8-20 10:51
比较技术公司的安全研究团队今天披露了一个不安全的数据库如何导致近2.35亿Instagram、TikTok和YouTube用户档案在网上暴露,这只能被描述为大规模的数据泄露。 最近,出现在暗网网络犯罪论坛上的关于账户数据的报道接二连三。从黑暗网络审计显示目前10万次入侵中有150亿个登录被盗,到黑客免费提供3.86亿......
2020-8-20 9:4
洛杉矶(美联社)--官员们周三表示,作为与洛杉矶市检察官办公室达成和解的一部分,天气频道移动应用程序的运营商已同意改变通知用户其位置跟踪做法和出售个人数据的方式。 市检察官迈克·费尔(Mike Feuer)在2019年的一起诉讼中声称,当应用程序用户同意分享他们的位置信息以换取个性化的预测和警报时,他们被误导了。相反......
2020-8-20 6:51
比较技术公司的安全研究团队今天披露了一个不安全的数据库如何导致近2.35亿Instagram、TikTok和YouTube用户档案在网上暴露,这只能被描述为大规模的数据泄露。 最近,出现在暗网网络犯罪论坛上的关于账户数据的报道接二连三。从黑暗网络审计显示目前10万次入侵中有150亿个登录被盗,到黑客免费提供3.86亿......
2020-8-20 2:38
数据伦理涵盖了令人难以置信的广泛主题,其中许多都是紧急的,每天都会成为头条新闻,而且现在会对真实的人造成伤害。一项关于100多个科技伦理教学大纲的荟萃分析,题为“当我们教授科技伦理时,我们教了什么?”她发现,科技伦理课程的主题千差万别(法律与政策、隐私与监控、哲学、司法与人权、环境影响、公民责任、机器人、虚假信息、工......
2020-8-19 22:54
这是七月里一个正常的下午。我正在我的小角落里工作,对着摄像机讲话。孩子们在他们的房间里,倒退着。我离开卧室和办公室去拿咖啡。我的配偶在我们的小厨房里,一边揉面团,一边打自己的视频电话。我偷听了一分钟。她不是程序员,但她说的是数据库。该数据库列出了需要食物、厨师、司机和送货的人。 我们已经过了纽约市的新冠肺炎高峰。一切......
2020-8-19 22:51
根据Motherboard获得的一份机动车管理局内部文件,加州机动车管理局(California Department Of Motor Vehicles)正在向私家侦探和保释担保人出售司机数据。All的文件列出了近9.8万个实体,它们已经获得了某种形式的机动车管理局数据,包括卡车运输公司和保险公司。 这一爆料突显出......
2020-8-19 20:3
针对万豪的代表诉讼由英国居民马丁·布莱恩特(Martin Bryant)代表数百万在英格兰和威尔士居住的酒店客人提起,这些客人在喜达屋酒店集团(Starwood Hotels Group)旗下的全球酒店品牌预订了房间。喜达屋酒店集团现在是万豪国际的一部分。 从2014年开始,黑客进入了喜达屋酒店集团(Starwood......
2020-8-19 8:36
在过去的几年里,Python在数据科学、机器学习、深度学习和数值计算方面大受欢迎。每年都有新的框架涌现,推动着这些领域的最新发展。所有这些活动和创造力的一个意想不到的后果是,支撑整个Python数据生态系统的基本构建块(多维数组(张量)和数据框库)出现了碎片化。例如,数组在TensorFlow、PyTorch、Num......
2020-8-19 5:8
勒索软件运营商继续向财力雄厚的公司发起闪电战,杰克·丹尼尔(Jack Daniel)的酿酒厂布朗-福尔曼(Brown-Forman)和邮轮巨头嘉年华(Carnival)是最新受到打击的两家公司。 布朗-福尔曼是一次网络安全攻击的受害者。我们发现攻击后的快速行动防止了我们的系统被加密。不幸的是,我们认为一些信息,包括员......
2020-8-18 23:53
截至2020年6月30日,Backblaze在我们的云存储生态系统中拥有142,630个旋转硬盘,分布在四个数据中心。其中,有2,271个引导驱动器和140,059个数据驱动器。此回顾着眼于我们数据中心当前运行的数据驱动器型号的2020年第2季度和整个生命周期的硬盘故障率,并在此过程中提供了一些见解和观察结果。我们一......
2020-8-18 11:23
安全思想与安全专家耶利米·福勒合作,揭露了一家人工智能公司泄露的数百万份个人医疗记录。以下是他的发现: 7月7日,我发现了250万条似乎包含敏感医疗数据和PII(个人身份信息)的记录。这些记录包括姓名、保险记录、医疗诊断笔记等。在进一步的研究中,有多次提到一家名为Cense的人工智能公司。这些记录被标记为临时数据,我......