#模型

PaddleOCR, Multilingual OCR Tools(github.com)

2021-1-4 20:32

PaddleOCR旨在创建多语言，出色，领先和实用的OCR工具，以帮助用户训练更好的模型并将其应用于实践。 2020.12.15更新了数据合成工具，即样式文本，易于合成与目标场景图像相似的大量图像。 2020.11.25更新新的数据注释工具，即PPOCRLabel，这有助于提高标记效率。此外，标记结果可直......

Handpose是手掌检测器和手部手指追踪器

Handpose is a palm detector and a hand-skeleton finger tracker(github.com)

2021-1-3 19:16

注意：此模型最多只能检测输入中的一只手-将来的版本中将提供多手检测。 MediaPipe Handpose是一个轻量级的ML管道，由两个模型组成：手掌检测器和手部骨骼手指跟踪模型。它预测每个检测到的手有21个3D手关键点。有关更多详细信息，请阅读我们的Google AI博客文章。给定输入，模型将预测它是否包含......

堆：用于语言建模的800GB多样文本数据集

The Pile: An 800GB Dataset of Diverse Text for Language Modeling(pile.eleuther.ai)

2021-1-2 8:26

堆是825 GiB的各种开源语言建模数据集，它由22个较小的高质量数据集组合而成。最近的工作表明，特别是对于大型模型，数据源的多样性改善了模型的一般跨域知识以及下游的泛化能力。在我们的评估中，不仅在桩上训练的模型在传统语言建模基准方面显示出适度的改进，而且在桩BPB上也显示出显着的改进。为了在桩BPB（每字......

机器学习需要大量精力

It takes a lot of energy for machines to learn(theconversation.com)

2021-1-1 8:48

本月，谷歌因对该公司撤回研究论文表示不满，迫使该公司退出了一位著名的AI伦理研究人员。本文指出了语言处理人工智能的风险，在Google搜索和其他文本分析产品中使用的类型。开发此类AI技术的巨大风险是其中的风险。据一些估计，训练AI模型产生的碳排放量与在其生命周期内制造和驾驶五辆汽车所需的碳排放量一样多。我是一......

2010年代有趣的研究计划

Interesting Research Programs from the 2010s(bcmullins.github.io)

2021-1-1 8:47

这篇文章的目的是介绍和讨论过去十年中几个有趣的研究程序。研究计划（或一个程序）是指具有相似假设，方法等的共同研究线程。以下列表包含各种研究程序：一些涉及广泛主题的研究，例如：可解释的机器学习和精神障碍；其他人则转移了整个行业的方向，例如计算机视觉和加密货币的进步；而其他一些仍然是我更感兴趣的利基领域，例如拓扑学习理论......

为什么AI如此耗电

Why AI is so power-hungry(arstechnica.com)

2020-12-29 20:59

本月，谷歌因对该公司撤回研究论文表示不满，迫使该公司退出了一位著名的AI伦理研究人员。该论文指出了语言处理人工智能的风险，在Google搜索和其他文本分析产品中使用的类型。开发此类AI技术的巨大风险是其中的风险。据一些估计，训练一个AI模型产生的碳排放量与建造和驾驶五辆汽车在其整个生命周期中所需的碳排放量一样多。 ......

计算模型揭示了大脑如何管理短期记忆

Computational Model Reveals How the Brain Manages Short-Term Memories(neurosciencenews.com)

2020-12-29 11:24

简介：一种新的计算算法显示了大脑如何在短期内使用特定类型的神经元维持信息。如果您仅在几秒钟之内就忘记了某件事，例如您打算在餐厅点菜的菜名，那么您就会知道工作记忆的重要性。这种短期召回方式是人们如何在几秒钟或几分钟内保留信息以解决问题或执行任务，就像一系列说明中的下一步一样。但是，尽管这对我们的日常生活至关重要，......

模型检查和模型评估中的似然原理

The likelihood principle in model check and model evaluation(statmodeling.stat.columbia.edu)

2020-12-23 21:30

（本文由Yuling撰写）在贝叶斯统计中，似然原理通常被表述为公理。当我们（仅）对估计未知参数感兴趣，并且有两个涉及数据生成实验的实验，每个实验都有可观察到的结果和，可能性和时，它适用。如果结果-实验对满足（作为函数），则这两个实验和两个观察将提供关于的相同推断信息。考虑一个经典的例子。有人正在进行AB测试，只对......

解释变压器语言模型的接口

Interfaces for Explaining Transformer Language Models(jalammar.github.io)

2020-12-23 4:21

Transformer体系结构为NLP的最新进展提供了动力。这里提供了此体系结构的详细信息。基于架构的预训练语言模型，包括自动回归模型（使用自己的输出作为下一个时间步长的输入以及从左到右处理令牌的模型，例如GPT2）和降噪（模型训练后的模型）破坏/屏蔽输入并双向处理令牌，例如BERT变种，在NLP和最近的计算机视觉的......

将照片转为素描DL模型

Turn ur photos to sketch DL Model(github.com)

2020-12-21 4:12

单击下面的图片，以了解有关colab演示的更多信息，感谢Bhavesh Bhatt提供的出色的YouTube视频。让我们对线稿肖像进行卡通化，它仍在制作中，但请看一些漂亮的图片。该模型产生的惊人结果给它带来了秘密。最初的模型无法创建我所期望的......

新的机器学习模型揭穿了“贫困线”概念

'Poverty line' concept debunked by new machine learning model(phys.org)

2020-12-18 20:29

数学家已使用机器学习来开发一种新的模型来衡量不同国家的贫困状况，从而使固定贫困线的旧观念变得杂乱无章。阿斯顿大学（Aston University）的学者发表在《自然通讯》（Nature Communications）上的这项研究表明，围绕贫困的主流思想已经过时，因为它过分强调基本需求的主观观念，而未能充分把握人们使......

提供用于流程自动化的企业AI工具的Indico筹集了2200万美元的B轮融资，使其总融资额达到3600万美元

Indico, which provides enterprise AI tools for process automation, raises $22M Series B, bringing its total raised to $36M(venturebeat.com)

2020-12-15 18:48

面向流程自动化的企业AI提供商Indico今天宣布已筹集2200万美元。该公司表示，这笔新资金将使其能够在2021年将员工人数增加一倍，聘请销售，合作伙伴和市场营销人员，同时扩大渠道关系和整合合作伙伴关系，以扩大其市场覆盖范围。流程发现和自动化是可以理解的大生意。 Forrester估计，到2019年，机器人流程......

干净的体系结构：域驱动的设计，第1部分

Clean architecture: Domain-driven design, part 1(ddimitrov.dev)

2020-12-14 22:2

上一次我们讨论软件体系结构时，我向您介绍了分层体系结构。今天，我们将从清洁架构（也称为洋葱或端口和适配器架构）开始，更具体地说是域驱动设计。干净架构作为一个概念比分层架构要复杂得多。因此，我决定将文章分为两部分。在今天的文章中，我将尝试简单地解释域驱动设计背后的思想。我们需要了解领域驱动的设计，因为它位于C......

斯坦福大学MLSys研讨会系列

Stanford MLSys Seminar Series(mlsys.stanford.edu)

2020-12-9 20:0

加入我们的电子邮件列表，即可每周获悉演讲者和直播链接的通知！机器学习正在推动计算领域的激动人心的变化和进步。机器学习的普遍性对人们如何构建和部署系统和应用程序意味着什么？在现实世界中部署机器学习系统时行业将面临哪些挑战？学术界如何应对这些挑战挑战？在本系列研讨会中，我们希望了解机器学习系统的前沿以及机器学习如......

缩减深度学习

Scaling Down Deep Learning(greydanus.github.io)

2020-12-5 21:24

构造MNIST-1D数据集。与原始MNIST数据集一样，任务是学习对数字0-9进行分类。与由28x28图像组成的MNIST数据集不同，这些示例中的每一个都是一维点序列。为了生成一个示例，我们从10位模板开始，然后如上所示随机填充，翻译，添加噪声并对其进行转换。从任何科学标准来看，人类基因组计划都是巨大的：它涉及......

机器学习的可解释性：概述

Interpretability in Machine Learning: An Overview(thegradient.pub)

2020-11-30 11:52

本文提供了机器学习可解释性子领域的广泛概述。尽管不详尽，但我的目标是审查概念框架，现有研究和未来方向。我遵循Lipton等人的模型可解释性神话中使用的分类，我认为这是了解不同可解释性定义的最佳论文。我们将探讨许多方法来形式化“可解释性”的含义。广义上讲，可解释性集中在方式上。它着重于对我们的模型所做出的决策进行解......

用于医学影像领域通用化的元学习框架

Meta Learning Framework for Domain Generalization in Medical Imaging(github.com)

2020-11-30 4:23

美国宾夕法尼亚州宾夕法尼亚大学放射学系宾夕法尼亚大学图像计算和科学实验室深度学习模型在目标（测试）数据域上进行测试时表现最佳，这些目标数据域的分布与源（训练）域的集合相似。但是，当目标域和源域之间的基础统计数据存在显着差异时，可能会妨碍模型泛化。在这项工作中，我们将基于模型不可知的元学习框架的领域概括方法应......

模拟大流行：Covid预报员可以从气候模型中学到什么

Simulating the pandemic: What Covid forecasters can learn from climate models(www.nature.com)

2020-11-16 21:27

预测新冠肺炎疫情蔓延的流行病学家应该采用气候建模方法，以使预测更加可靠，计算机科学家表示，他们花了几个月的时间审计这种最具影响力的疫情模型之一。在11月6日上传到预印平台研究广场的一项研究中，伦敦皇家学会委托的研究人员使用一台强大的超级计算机重新检查了由伦敦帝国理工学院的一个团队开发的CovidSim模型。今年3月......

骑行硬件彩票

Ride the Hardware Lottery(pagestlabs.substack.com)

2020-11-13 19:36

这篇文章在很大程度上依赖插图，插图是嵌入的图像。如果你是通过电子邮件阅读这篇文章，最好是直接在子栈上阅读，因为一些电子邮件客户端会剪辑长邮件并屏蔽图像。正如你可以从佩奇大街实验室的前两篇帖子中看出的那样，最近我一直痴迷于超大参数(VLP)模型。我并不总是这样。在我的个人博客和推特上，我已经写了足够多的关于通过层层叠......

研究称，停止温室气体排放可能无法阻止全球变暖

Ending Greenhouse Gas Emissions May Not Stop Global Warming, Study Says(phys.org)

2020-11-13 19:5

根据周四发布的一项有争议的模型研究，即使人类明天停止排放温室气体，未来几个世纪地球仍将变暖，海平面将上升数米。挪威研究人员在《自然·科学报告》杂志上报道，全球变暖的自然驱动力--更多吸热的云层、融化的永冻土和不断缩小的海冰--已经由碳污染引发，它们将呈现出自己的势头。主要作者、BI挪威商学院气候战略荣休教授约尔根·......

CQRS：命令查询责任分离

CQRS: Command Query Responsibility Segregation(martinfowler.com)

2020-11-11 21:49

CQRS代表命令查询责任分离。这是我第一次听到格雷格·杨(Greg Young)描述的一种模式。其核心是这样一个概念，即您可以使用与读取信息所用的模型不同的模型来更新信息。对于某些情况，这种分离可能很有价值，但请注意，对于大多数系统来说，CQRS增加了风险复杂性。人们在与信息系统交互时使用的主流方法是将其视为CRU......

如何阻止餐馆引发Covid感染

How to stop restaurants from driving Covid infections(www.nature.com)

2020-11-11 8:33

在世界各地的城市，冠状病毒的暴发都与餐馆、咖啡馆和健身房有关。现在，一种使用手机数据绘制人们活动地图的新模型表明，这些场所可能是美国城市中大多数新冠肺炎感染的原因。今天发表在《自然》杂志上的这一模型还揭示了减少场馆占有率可以显著降低感染人数。考文垂华威大学(University Of Warwick)经济学家蒂埃......

研究人员希望通过将通过无监督学习(如GPT-3)训练的语言模型与有标签的计算机视觉数据集相结合，将常识注入人工智能

Researchers want to infuse common sense into AI by merging language models trained via unsupervised learning, like GPT-3, with labeled computer vision datasets(www.technologyreview.com)

2020-11-9 2:49

你可能已经听过我们无数次这样说：GPT-3，这个能发出不可思议的类似人类语言的巨型人工智能，是一个奇迹。这在很大程度上也是一种海市蜃楼。你可以用一个简单的技巧来分辨：问它绵羊的颜色，它会像暗示“白”一样频繁地暗示“黑”--这反映了我们俗语中的“害群之马”。这就是语言模型的问题所在：因为它们只接受文本方面的训练，缺乏......

Lobe.ai现在处于公开测试版

Lobe.ai is now in public beta(lobe.ai)

2020-10-31 2:2

使用免费、易于使用的工具创建机器学习模型。LOPE使用免费、易用的工具帮助您训练机器学习模型。 LOPE拥有将您的机器学习想法变为现实所需的一切。只需向它展示你想让它学习的例子，它就会自动训练一个可以在你的应用程序中附带的自定义机器学习模型。 LOPE将自动为您的项目选择正确的机器学习体系结构。图像分类现在可以使用了......

Played解析事务数据

Plaid Parses Transaction Data(blog.plaid.com)

2020-10-23 2:56

在Play，我们将金融账户与应用程序联系起来，消除了我们的客户与金融机构建立个人连接的需要，并标准化了跨多个账户使用的数据。这意味着开发者可以专注于创造创新的产品和服务。我们面临的最有趣的挑战之一是前面提到的数据标准化或标准化：我们如何简化数千种不同格式的数据，以便以数千种不同的方式使用，我们为什么要这样做？ “为......

低代码型与模型驱动型：它们是一样的吗？

Low-code vs model-driven: are they the same?(modeling-languages.com)

2020-10-22 9:37

由于低代码化成为新的流行语，我想知道与我们过去所说的模型驱动工程/开发相比，低代码化运动是否真的有什么不同。第一次低代码研讨会(2020模型大会的一部分)是花一些时间来反思和记录我对这个主题的想法的完美借口。接下来你能读到的，是我思考的结果。我还嵌入了我准备展示论文的演讲幻灯片(见底部)。两者都包含了我在发布这篇文......

白手起家建立创业财务模式

Build a startup financial model from scratch(www.mathventurepartners.com)

2020-10-22 8:54

本文最初发表在这里的Startup Rocket网站上，由威尔·利特尔(Will Little)和特洛伊·亨尼科夫(Troy Henikoff)撰写。本系列是我最近与前Techstar芝加哥加速器董事总经理特洛伊·亨尼科夫(Troy Henikoff)就创始人在构建财务模型时应采取的最佳方法进行友好辩论的结果。更准......

基于最小费用流的神经解码：从UGARIC到线性B

Neural Decipherment via Minimum-Cost Flow: From Ugaritic to Linear B(arxiv.org)

2020-10-22 8:49

下载PDF摘要：在本文中，我们提出了一种新的神经网络方法来自动破译丢失的语言。为了弥补强监督信号的不足，我们的模型设计参考了历史语言学记载的语言变化模式。该模型利用一种富有表现力的序列到序列模型来捕捉同源词之间的字符级对应关系。为了以无监督的方式有效地训练模型，我们创新了训练过程，将其形式化为最小费用流问题。将其应用......

用统计建模预测足球比赛成绩

Predicting Football Results with Statistical Modelling(dashee87.github.io)

2020-10-21 0:31

结合世界上最受欢迎的运动和每个人最喜欢的离散概率分布，这篇帖子使用泊松分布预测足球比赛。足球(对我的美国读者来说是足球)充满了陈词滥调：“这是一场两个半场的比赛”、“一场比赛一场比赛”和“利物浦没能赢得英超联赛”。你不太可能听到“将每支球队的进球数量视为独立的泊松过程，统计模型显示主队今天有60%的机会获胜”。但这......

为什么深度学习能奏效，尽管它不应该奏效

Why Deep Learning Works Even Though It Shouldn’t(moultano.wordpress.com)

2020-10-20 22:43

这是一个很大的问题，我也不是一个特别高大的人。因此，对于深谙文学和理论的人来说，这些都可能是显而易见的观察。然而，我发现，有一种潜移默化的直觉是专家对一个领域的理解的基础，这些直觉从来没有在文献中直接陈述过，因为它们不容易用文献要求的严谨性来证明。因此，洞察力只存在于对话和潜台词中，这使得普通读者无法接触到它们。因......