data

2020-10-28 0:9
正如联合创始人兼首席执行官文卡特·文卡塔拉马尼(Venkat Venkataramani)在2018年首轮比赛时告诉我的那样,让数据准备好使用需要大量的人工工作,这是获得真正洞察力的障碍。他希望用Rockset来改变这一点。 我们正在用创新的架构和独特的功能来构建我们的服务,这些功能可以直接在原始数据上实现全功能的F......
2020-10-27 23:25
这家成立于2015年的公司在很大程度上坚持了其最初的愿景,即始终致力于将数据仓库的访问民主化,以及与之齐头并进的分析能力。在过去的几年里,它还在平台中构建了更多的无代码数据集成,使企业更容易从各种来源获取数据,包括Salesforce、HubSpot、NetSuite、Xero、Quickbook、FreshWork......
2020-10-26 8:20
这将是我在互联网上发表的第一篇博客文章。希望它是有趣和准确的。如果你看到任何错误,请指出! 2016年,我做了一些工作,试图找到停车罚单的热点地区,看看一点点数据是否可以减少这些地区的停车罚单。最后,我只清理了一个,但它是芝加哥所有罚单最多的地方之一,导致停车罚单减少了大约50%。 芝加哥用来存储停车罚单的系统被称为......
2020-10-24 7:28
英国议会虚假信息特别顾问查尔斯·克里尔(Charles Kriel)和电影制片人凯瑟琳娜·盖莱(Katharina Gellein)在一组记者和举报人的陪同下,在美国各地旅行,制作了他们的纪录片人物You May Kriel。他们的电影揭示了宗教原教旨主义者、寡头和剑桥分析公司及其空壳公司之间的政治联系,这将从根本上......
2020-10-21 2:4
微软今天发布了一款可部署到偏远地区的模块化数据中心,并与SpaceX合作,通过Starlink卫星宽带将这些数据中心连接到互联网。微软表示,Azure模块化数据中心(MDC)面向在混合或具有挑战性的环境(包括偏远地区)中需要云计算能力的客户,适用于移动指挥中心、人道主义援助、军事任务需求和矿产勘探等场景。 微软表示,......
2020-10-18 23:9
当我们在学校里被教授集合论时,我想知道为什么他们用了整整一章的数学来教我们如何将项目分类。具有相似属性的实体组合在一起不是很明显吗? 十多年后,我意识到,当他们教给你一些东西时,也许整个主题并不重要,重要的是关于这个主题的一小部分信息,这些信息将来可能会派上用场。 为什么这个看似微不足道的事实会成为我精神健全的关键呢......
2020-10-18 0:36
一家名为HYAS的威胁情报公司,这是一家试图阻止或调查针对其客户的黑客攻击的私营公司,正在购买从安装在世界各地人们手机上的普通应用程序获取的位置数据,并用这些数据来揭开黑客的面纱。该公司是一家企业,而不是执法机构,并声称能够追踪人们到他们的家门口。 这则新闻突显了位置数据的复杂供应链和销售,从用户在某些情况下没有意识......
2020-10-7 17:36
在英国,近16000例冠状病毒病例没有上报,原因是对微软Excel软件的使用考虑不周。 而且似乎应该归咎于英国公共卫生(PHE),而不是第三方承包商。 这个问题是由该机构将商业公司制作的日志汇集在一起的方式引起的,这些公司付钱分析公众的拭子测试,以发现谁感染了病毒。 他们以基于文本的列表-称为CSV文件-的形式提交了......
2020-10-7 15:14
据Motherboard获得的一封信的副本显示,负责监督美国国税局的机构在一封信中宣布,它将调查国税局使用安装在人们手机上的普通应用程序收集的位置数据。 此前,参议员罗恩·怀登(Ron Wyden)和伊丽莎白·沃伦(Elizabeth Warren)要求对美国国税局(IRS)如何在没有搜查令的情况下使用位置数据追踪美......
2020-10-7 15:13
伦敦-欧盟最高法院对试图通过有争议的间谍技术监视公民的政府造成了又一次打击。 欧盟最高法律权威欧洲法院(ECJ)周二裁定,成员国不能收集公民的海量移动和互联网数据。 法院在裁决中解释说,强迫互联网和电话运营商进行普遍的、不分青红皂白的交通数据和位置数据的传输或保留是违反欧盟法律的。 然而,如果一个会员国面临的国家安全......
2020-10-7 8:40
本文摘自我即将出版的一本关于面向数据编程的书。这本书一旦完成(希望在2021年),将由曼宁出版。 本章试图说明我所理解的面向数据编程的核心原则是什么,它深受我在Clojure编程经验的影响,但我相信这些原则是语言不可知的。 您可以在面向对象(OO)语言(如Java或C#)中遵守它们,也可以在Ocaml、Haskell......
2020-9-29 5:55
第四频道新闻独家获得了唐纳德·特朗普2016年总统竞选中使用的近2亿美国选民的大量数据。 调查显示,350万美国黑人被唐纳德·特朗普的竞选团队归类为“威慑”选民,即他们希望在选举日呆在家里的选民。 今晚,民权活动家表示,这些证据相当于一种新形式的选民“压制”,并呼吁Facebook披露从未公开的广告和目标信息。 “威......
2020-9-26 9:30
有什么意见、建议或只是想聊聊这个话题吗?不要犹豫,在文章下方我们改进的评论区留下评论吧! 2016年2月11日,美国激光干涉仪引力波天文台(LIGO)的科学家宣布首次探测到引力波,创造了历史。这些波最初是由爱因斯坦的广义相对论在一个世纪前预测的,本质上是由重大天文事件-例如双星黑洞对的合并-形成的时空涟漪。 这一发现......
2020-9-26 3:13
马克·赛特是七次CIO,三次CIO 100奖获得者,两次写书的作者。他的最新著作是“来自硅谷的真相:未来十年IT管理实用入门”(";Truth from the Valley:A Practice Primer on Next 10年)。 托默·Y·阿夫尼(Tomer Y.Avni)是哈佛商学院(Harvard......
2020-9-25 1:4
Facebook今天推出了Dynabench,这是一个用于人工智能数据收集和基准测试的平台,它使用“循环中”的人和模型来创建具有挑战性的测试数据集。利用一种名为动态对抗性数据收集的技术,Dynabench衡量了人类欺骗人工智能的难度,Facebook认为,与目前的基准相比,人工智能是衡量模型质量的更好指标。 许多研究......
2020-9-24 7:52
社会疏远,一种旨在减少新冠肺炎传播的非药物策略,可能是因为个人自愿与他人保持距离,以避免感染这种疾病。或者,它也可能是由于地方当局施加的司法限制而出现的。我们对49个州运行作为县级外生人口变量和司法固定效应函数的简化形式的社会距离模型,以评估人口和司法影响在解释社会距离行为中的相对贡献。为了考虑到传染性疾病的可能的空......
2020-9-24 0:6
Shopify最近发生的一起数据泄露事件影响了近200家Merchange,这起事件被归因于内部人士。 这起事件不是由于技术漏洞造成的,而是因为两名流氓支持团队员工参与了一个获取客户交易记录和敏感数据的计划。 Shopify对这起事件进行了调查,发现此次入侵影响到200家Shopify商家。联邦调查局也得知了调查结果......
2020-9-23 23:35
安全研究员鲍勃·迪亚琴科(Bob Diachenko)收到联系人萨米·托沃宁(Sami Toivonen)的提示,称一台未受保护的服务器包含近1TB的电子表格,代表公司多年的内部数据,包括财务记录和个人客户记录。但由于服务器上没有密码,任何人都可以访问其中的文件。 城镇体育在迪亚琴科联系该公司后不久就让服务器离线了。......
2020-9-23 5:12
一名新墨西哥州男子接到联邦儿童福利官员的电话。他十几岁的弟弟独自一人抵达边境,此前他长途跋涉2000英里,以躲避危地马拉一名暴力的叔叔。官员们要求他照看这个男孩。他犹豫不决;他自己也是非法移民。官员们说不用担心。他同意了,并向官员们提供了他的信息。七个月后,ICE特工在他的家中逮捕了他,并启动了驱逐程序。 马里兰州郊......
2020-9-23 4:37
听我讲了5分钟以上的人可能都知道,我最喜欢的软件书,无一例外,就是数据和现实。这是关于如何..。
2020-9-23 0:28
Yelp周三发布了最新的经济影响报告,披露由于冠状病毒的影响,美国各地的企业关闭数量正在增加。 截至8月31日,Yelp上已有163,735家企业表示他们已经关闭,自7月中旬以来增长了23%。 根据Yelp的数据,永久关闭的企业已经达到97,966家,占关闭企业不会重新开业的60%。 Yelp周三发布了其最新的经济影......
2020-9-22 23:51
从数据库获取数据到Apache Kafka肯定是Kafka Connect最流行的用例之一。Kafka Connect提供了可扩展且可靠的方式将数据移入和移出Kafka。因为它将插件用于连接器的特定插件,并且它只通过配置运行(不需要编写代码),所以它是一个简单的集成点。 我们可以使用以下docker-compose文......
2020-9-22 2:59
Kivaloo(发音为";kee-va-lieu";)是一组实用程序,它们共同形成一个数据存储,将最多255字节的键与最多255字节的值相关联。它旨在满足Tarsnap在线备份服务对高性能键值存储的需求,尽管它尚未用于此目的。 目前,kivaloo包括在本地文件系统内提供日志结构存储的块存储(LBS);管......
2020-9-22 2:58
根据周一发布的一份报告,谷歌和几家数据经纪人正在违反欧盟的隐私规定,他们收集人们的个人信息来建立非常详细的在线个人资料,包括一些公司收集性取向、健康状况和宗教信仰的信息。 这些指控出自非政府组织爱尔兰公民自由理事会(IRC)高级研究员约翰尼·瑞安(Johnny Ryan)之口。18个月前,爱尔兰隐私监管机构开始调查谷......
2020-9-21 18:20
在此之前,爱尔兰数据保护委员会(DPC)已经投诉了两年,指控通过程序化广告实时竞价(RTB)过程非法利用个人数据-包括由谷歌和互联网广告局(IAB)设计的占主导地位的RTB系统。 在约翰尼·瑞安(Johnny Ryan)博士(当时在Brave工作,现在是ICCL高级研究员)于2018年9月提起申诉后,爱尔兰DPC于2......
2020-9-21 2:53
曾经有一段时间,我可以想出一些办法,直接从原始数据中找出,然后通过这些破布向世界脱口而出我的结论,看看会发生什么。而不可避免的是,一千名专家会突然叫我闭嘴,说我太蠢了,不能阅读,更不用说写作了。除了偶尔我做对了(纯粹是运气),所以,该死的,他们不得不一直读我的作品。嗯,我回来再试一次,它来了:当自动驾驶汽车的历史被书......
2020-9-21 2:51
就像我应该做的很多事情一样,但不要 - 锻炼,吃得好,睡得好,在公共场所为女性和少数族裔挺身而出 - 备份我的数据一直是我最多也就是半途而废的事情。 在过去的10年里,我拖着一个外置硬盘,里面有几百GB的数据,大约每三四年备份一次。每次我尝试从这些备份中恢复任何东西时,我都会后悔,因为我当然只是买了驱动器,插上电源,......
2020-9-19 3:15
VSCode调试可视化工具是一个VSCode扩展,允许您在编辑器中可视化数据结构。这对于在调试期间可视化监视的值非常有用。我发现这个扩展可以帮助可视化绘图、表格、数组、直方图和树。 安装扩展后,打开一些相关脚本,然后导航到命令面板并转到Debug Visualizer:new View。此视图允许您在单步执行代码时输......
2020-9-18 3:14
面向数据的设计是一种通过仔细考虑数据结构的内存布局及其对自动向量化和CPU高速缓存使用的影响来优化程序的方法。如果您还没有看过Mike Acton的“面向数据的设计和C++”演讲,我强烈推荐您去看一下。 数组结构与结构数组是指组织要操作的实体数据的两种截然不同的方式。 例如,假设我们正在编写一个视频游戏,并且我们希望......
2020-9-17 15:24
这笔融资由Initialized Capital牵头,以及Flybridge Capital Partners和Y Combinator-这家初创公司在2019年的队列中-以及包括保罗·布赫海特(Paul Buchheit)在内的新投资者的持续投资。 Narrative已经存在了三年,但其第一阶段的基础是作为咨询公司......