#数据

2020-10-23 2:9
克里斯汀·廷斯基(Kristin Tynski)是Fractl的联合创始人兼创意高级副总裁,Fractl是一家成长型营销机构,帮助财富500强公司和精品企业获得高质量的媒体报道、反向链接、知名度和权威。 在某些情况下,这可能是一个很好的建议。但我想说的是,创建能够持续产生大量高权威链接的内容是非常有可能的。我在实践中......
2020-10-23 1:54
这个真挚而幽默的故事描述了陷入传统与现代冲突中的女孩的生活。阅读亚马逊上的订单摘录。 这在第一次学习向量时很有用:向量进去,新的出来。不幸的是,这可能会导致过度依赖几何可视化。 如果有20个家庭来参加你的烧烤,你如何估计你需要的热狗?(人力资源管理…。20个家庭,每个家庭3人,每个…2个热狗。大约20*3*2=120......
2020-10-22 8:49
“这位是布莱恩·塞尔丰,这里的首席调查分析师。”我在布鲁克林地区检察官办公室的老板正在把我介绍给纽约警局的两名侦探,当他说这句话的时候声音里有一个眨眼的声音:此时此刻,我是唯一的调查分析员。我的团队在接下来的三年里会发展壮大,但现在我是-我的电子表格的负责人? “我们对街头小贩不感兴趣,”我的老板继续解释我们部门的角......
2020-10-21 19:45
开源代码库贡献解决了金融服务业的数据效率和治理挑战。 2020年10月19日/金融科技开源基金会(以下简称FINOS)与白金会员高盛(GS)今天宣布,高盛旗舰数据管理和数据治理平台联想云正式上线。由银行所有部门的工程师和非工程师内部开发并使用,其中五个平台模块的源代码今天已经在finos中作为开源提供。 在今天的发布......
2020-10-21 5:6
创始人兼首席执行官科里·雅斯科尔斯基(Corey Jaskolski)过去的经验包括在国家地理(National Geological)(他最近被评为年度最佳探险家)和一家3D媒体初创公司工作过。事实上,他告诉我,他在国家地理工作的时间让他意识到在保护方面需要更多的数据集。 听起来像是奇怪的搭配吗?贾斯科尔斯基说,他......
2020-10-21 1:56
亚马逊自己的商店,如全食超市(Whole Foods)、亚马逊Go、亚马逊四星(Amazon Four Star)和亚马逊图书(Amazon Books)都不符合条件。 项目参与者将利用iOS和Android上新推出的Amazon Shopper Panel移动应用程序为符合条件的纸质收据拍照,或者他们可以选择将电子......
Disney Animation data sets (2018)(blog.yiningkarlli.com)
2020-10-20 22:36
今天在EGSR 2018年上,华特迪士尼动画工作室宣布发布两个用于渲染研究的大型制作质量/比例数据集。数据集可在迪士尼动画官方网站的新数据集页面上找到。第一个数据集是云数据集,其中包含一个大型且高度详细的体云数据集,我们在SIGGRAPH 2017论文中使用了该数据集,第二个数据集是莫阿纳岛场景,这是Moana的完整......
2020-10-20 22:11
如今,在大卫·萨克斯(David Sacks)、Slake、Gradient Ventures、Y Combinator和其他个人投资者的260万美元种子投资的帮助下,他们可以继续实现这个梦想。 吸引这项投资的是几位年轻的创始人,他们热衷于让构建数据仪表盘变得简单,而不需要工程师或数据分析师等专家的帮助。 “从本质上......
2020-10-20 2:23
Datasette(以前)是我用于浏览和发布结构化数据的开源工具。在Datasette中嵌入了很多想法。我意识到我并没有把很多东西写下来。 Datasette为您的数据提供只读API。它不尝试处理写入。完全避免写入是众多有趣属性的基础,其中许多属性将在下面进一步展开。简而言之: 在2018年,托管没有读/写持久性要求......
2020-10-19 21:5
其中一些听起来可能很熟悉,因为对于文档人工智能,Google Cloud已经提供了一个更通用的工具,用于在复杂文档上执行OCR,然后从这些文档中提取数据。Lending DocAI实质上是第一个使用该技术的垂直专业化Google Cloud服务。 谷歌产品经理Sudheera Vanguri写道:“我们的目标是为您提......
2020-10-19 20:8
新加坡将成为世界上第一个在国家身份证计划中使用面部验证的国家,但隐私权倡导者对他们所说的容易被滥用的侵入性系统感到震惊。 从明年开始,生活在这个城市国家的数百万人将能够通过快速面部扫描获得政府机构、银行服务和其他便利设施。 这种生物识别检查的发明者说,在执行许多日常任务时,这种生物识别检查将不再需要记住密码或安全加密......
2020-10-19 15:27
在斯坦福大学普雷库特能源研究所(Stanford University‘s Precourt Institute for Energy)的一个实验室里,有六个冰箱大小的橱柜,旨在尽可能快地耗尽电池。每个都可以容纳大约100个锂离子电池,固定在托盘中,每天可以对电池进行数十次充放电。通常情况下,进入这些电化学刑讯室的电......
2020-10-19 3:55
机器学习通常需要大量的例子。要让人工智能模型识别一匹马,你需要向它展示数以千计的马的图像。这就是这项技术在计算上昂贵的原因-而且与人类学习有很大的不同。孩子通常只需要看到几个物体的例子,甚至只有一个,才能终生识别它。 事实上,孩子们有时不需要任何例子来识别东西。他们展示了一匹马和一头犀牛的照片,并告诉他们独角兽介于两......
2020-10-19 2:35
作为数据工程师,您将编写大量代码来处理各种业务案例,如ETL、数据流水线等。事实上,数据工程的标准语言是Python(不要与用于数据科学的R或NIM混淆,它们在数据工程中没有任何用处)。 RDBMS是任何应用程序数据的基本构建块。数据工程师应该知道如何设计和设计其结构,并了解与其相关的各种概念。 NoSQL是任何非关......
2020-10-18 8:53
作为一个行业,我们非常擅长构建大型、复杂的软件系统。我们现在开始看到围绕数据构建的大规模复杂系统的兴起--系统的主要业务价值来自数据分析,而不是直接来自软件。我们看到这一趋势对整个行业的快速影响,包括新角色的出现,客户支出的转变,以及围绕数据提供基础设施和工具的新初创公司的出现。 事实上,许多当今增长最快的基础设施初......
2020-10-18 8:1
旧金山初创公司Cribl Inc.。今日表示,它已经筹集了3500万美元,由红杉资本(Sequoia Capital)牵头,让公司在使用哪些基础设施监控工具方面有更大的灵活性。 技术环境会生成大量机器数据,这些数据对于检测停机和查找安全漏洞等任务非常有用。市面上有很多监控工具承诺帮助解锁这些数据的价值。然而,公司经常......
2020-10-17 2:8
信息专员办公室(ICO)对英国航空公司(British Airways)处以2000万英镑(约合2600万美元)的罚款,原因是一起数据泄露事件影响了40多万名客户。 这笔罚款比ICO最初表示打算在2019年开出的1.83亿GB要小得多。 这起事件发生时,英航的系统被攻击者攻破,然后在输入客户详细信息时进行修改,以获取......
2020-10-16 20:19
信息专员办公室(ICO)对英国航空公司(British Airways)处以2000万英镑(约合2600万美元)的罚款,原因是一起数据泄露事件影响了40多万名客户。 这笔罚款比ICO最初表示打算在2019年开出的1.83亿GB要小得多。 这起事件发生时,英航的系统被攻击者攻破,然后在输入客户详细信息时进行修改,以获取......
2020-10-16 3:59
虚拟现实(VR)是一项正在消费者市场获得吸引力的技术。随之而来的是一种前所未有的跟踪身体运动的能力。这些身体动作是对个人身份、医疗条件和精神状态的诊断。以前的工作集中在理想化情况下身体运动的可识别性,在这种情况下,研究设计者选择了一些动作。相比之下,我们的工作是在典型的VR观看环境下测试用户的可识别性,没有专门设计识......
2020-10-16 2:14
招聘中的本能感觉和“随心所欲”应该谨慎对待,决策应该始终基于你准确指出的与角色相关的证据。
2020-10-16 1:2
对于周四的第一次出版,我想和你们大家一起做一个“如果”的练习。他们说,这种“如果”技术就是Spotify等公司使用的技术(“如果你不必拥有自己的音乐库呢?”)。优步(Uber)(“如果每辆车都有可能变成出租车会怎么样”)达到他们目前的模式。 所以让我们试一试同样的东西。让我们问问自己:“如果互联网先离线会怎么样?如果......
2020-10-16 0:35
我们正在扩展您可以使用Workers构建的内容,以包括需要跨多个Workers和存储使用同步的用例-这些用例是Workers KV无法解决的。 同步访问:针对特定持久对象的每个Worker请求都被路由到同一实例,从而允许跨多个Worker进行协调。 可伸缩性:单个持久对象的开销几乎为零。应用程序可以一次将数据访问分散......
2020-10-15 6:5
我一直在开发一个应用程序,它的核心是存储大量数据,这些数据主要是通过使用外键和时间戳字段来组织的。表自己的主键是基于UUID的,将外键与单个记录本身的UUID组合在一起,并且它有一个使用JSONB类型的主数据字段,因为它可以接收任意数据。该表可以看到频繁的、定期的插入和周期性的删除,旧数据会随着时间的推移而变得稀疏,......
2020-10-14 20:54
谷歌网络分析平台的最新版本名为谷歌分析4(Google Analytics 4),现已面世。新的属性类型包括扩展的预测洞察力、与谷歌广告的更深入集成、跨设备测量功能和更精细的数据控制。 周三宣布的这一版本是对去年推出的App+Web属性的扩展和品牌重塑,标志着超越Universal Analytics迈出了重要的第一......
2020-10-14 1:2
我们谈论的是雪花大战AWS,数据仓库,以及数据让决策者无能为力。 AWS与Databricks和Snowflake等公司之间的动态是我以前想知道的。很难不这样做,因为AWS拥有自己的产品,是Databricks(EMR)和Snowflake(RedShift)的直接竞争对手。与此同时,Databricks和Snowf......
2020-10-13 23:45
研究人员正在建立多样化的训练数据集,其中包括来自视力低下者和患有ALS等疾病的人的信息。 盲人或使用轮椅或患有自闭症的人通常是技术的早期采用者,以完成日常任务,如交流、阅读和旅行。人工智能为其中许多服务提供动力,如语音和对象识别。在许多情况下,这些产品都是根据来自健全人或神经官能者的数据进行训练的。这意味着算法可能对......
2020-10-12 21:59
9月底,在一如既往的秋季硬件发布会中,亚马逊在五天内推出了两款特别具有未来主义风格的产品。第一架是一架小型自动监视无人机“Ring Always Home Cam”,它在充电码头内耐心等待,最终会升起并在你家周围飞行,检查你是否把炉子开着,或者调查潜在的入室盗窃事件。第二个是手掌识别扫描仪,亚马逊一号(Amazon ......
2020-10-12 21:39
欧洲科学家周三宣布,在全球范围内,上个月是有记录以来最热的9月,超过了一年前创下的纪录。 这也是欧洲有记录以来最热的9月。西伯利亚北部、西澳大利亚、中东和南美部分地区的气温也同样高于平均水平。 这一声明是由欧盟支持的政府间机构哥白尼气候变化服务机构(Copernicus Climate Change Service)......
2020-10-12 7:11
任何数据分析工作流程中的第一个任务就是简单地读取数据,这绝对必须快速有效地完成,这样才能开始更有趣的工作。在许多行业和领域,CSV文件格式是存储和共享表格数据的王道。快速可靠地加载CSV至关重要,它必须能够很好地扩展到各种文件大小、数据类型和形状。这篇文章比较了在三个不同的CSV解析器上读取8个不同的真实世界数据集的......
2020-10-11 18:10
散点图。你可能不知道他们的名字,但如果你在网上花10分钟以上,你会发现他们无处不在。它们在新闻文章中很受欢迎,在数据科学界也很受欢迎,也许最关键的是,它们在互联网上传播了关于煎饼消化质量的模因。 通过将数据描述为两个轴上的大量点,散点图在可视化趋势、相关性和异常方面非常有效。但是,将它们用于大型数据集通常会导致重叠的......