#模型

2020-8-24 4:18
开放领域问答模型-理论上能够用新奇的答案回答新问题的模型-通常只是简单地记忆在它们所训练的数据中找到的答案,这取决于数据集。这是一个隶属于Facebook和伦敦大学学院的研究团队的断言,他们在一篇预印本论文中提出了证据,证明在开放领域基准测试的模型给出的答案中,有60%-70%嵌入了训练集中的某个地方。 开放领域问答......
2020-8-19 2:54
阿努帕姆·达塔(Anupam Datta)是Truera的联合创始人、总裁兼首席科学家,也是卡内基梅隆大学(Carnegie Mellon University)的教授。 贾斯汀律师是Truera的首席产品官,曾担任谷歌云AI平台的产品负责人。 公司需要采取措施深入检查ML模型,并获得有效更新模型和周围业务规则所需的......
2020-8-18 23:24
下载PDF摘要:我们指出,在一些以前考虑的超越标准模型的物理理论中,可以有人类可穿越的虫洞解决方案,即兰德尔-桑德鲁姆模型。
2020-8-18 14:28
2美国宾夕法尼亚州哈里斯堡,宾夕法尼亚州环境保护部病媒管理司, 这是一篇开放获取的文章,根据知识共享署名许可证的条款分发,该许可证允许在任何媒体上不受限制地使用、分发和复制,前提是原始作者和来源都得到了适当的信用证明。 亚洲虎蚊白纹伊蚊(Aedes albopictus(Skuse))是一种入侵物种,具有大量的叮咬活......
2020-8-18 10:30
在很多方面,这使得它类似于AlphaGo或深蓝;虽然在一个领域接近人类的能力(下国际象棋/围棋,或者真正令人印象深刻的写作),但它似乎不会真的像AlphaGo很快就会把地球变成回形针一样。虽然它的著作在模仿人类方面令人印象深刻,但GPT-3(或任何潜在的未来GPT-x)对过去的交互没有记忆,也不能遵循目标或最大化效用......
2020-8-17 2:56
如果你喜欢这篇文章,请点击这里查看我的免费书籍:“检疫中要读的东西:2018-2020年的随笔”。 是语言学、计算机科学、信息工程和人工智能的一个子领域,研究计算机和人类(自然)语言之间的相互作用,特别是如何对计算机进行编程,以处理和分析大量的自然语言数据。 在最近机器学习技术突飞猛进的过程中,该领域取得了巨大的进步......
2020-8-15 4:52
只需几行代码即可为ML模型、函数或API生成易于使用的UI。
2020-8-15 2:52
Google下属的研究人员今天发布了语言可解释性工具(LIT),这是一个开源的、与框架无关的平台和API,用于可视化、理解和审计自然语言处理模型。它集中在关于人工智能模型行为的问题上,比如为什么模型做出某些预测,为什么他们在输入语料库中表现不佳。LIT将聚合分析合并到一个基于浏览器的界面中,该界面旨在实现对文本生成行......
2020-8-12 9:59
气候危机:最新气候模型预测,到2035年,北极可能没有海冰。 上一次北极没有海冰时,河马在现在的约克郡漫步。 “独立报”在世界各地聘请记者,为您带来真正独立的新闻报道。为了支持我们,请考虑一笔额外的捐款。 大约12.7万年前,在最后一次间冰期,北极的温度上升到比今天高出2-6摄氏度左右,最终融化了地球北极的所有海冰。......
2020-8-2 23:2
安德里亚·加利亚诺(Andrea Gagliano)是盖蒂图像公司(Getty Images)数据科学的负责人,她专注于计算机视觉和自然语言处理。她领导盖蒂图像公司(Getty Images)的科学家、工程师、产品设计师和商业领袖关于构建符合道德的人工智能产品的教育。 2020年人工智能培训的问题是,突然之间,我们改......
2020-7-29 4:15
三大云提供商最近都推出了用于培训自定义对象检测模型的无代码工具。但是,到目前为止,很少有关于它们性能的独立研究发表(无论是相对于彼此还是针对最先进的开源模型)。我们通过所有这三个工具运行了一个标准数据集,以查看它们之间的对比情况。 如果您正在考虑在您的产品中使用来自Google Cloud、AWS或Azure的计算机......
2020-7-28 21:25
Otto是一款智能聊天应用程序,旨在帮助有抱负的机器学习工程师用最少的领域知识从想法到实现。我们的网站具有轻松的模型选择、富有洞察力的可视化效果和直观的自然语言体验,为您提供每一步的指导。 我们很高兴地告诉大家,奥托因其对Wit.ai NLP平台的创新使用,在2020年Facebook人工智能挑战黑客马拉松系列赛中获......
2020-7-28 3:50
(实时帖子,将在未来几天内更新新的视觉效果和润色)。 输出是根据模型在其训练期间扫描大量文本期间“学到”的内容生成的。 训练是让模型接触到大量文本的过程。它已经完成了一次,而且是完整的。你现在看到的所有实验都来自那个训练有素的模型。据估计,它耗资355年的GPU,耗资460万美元。 使用3000亿个文本标记的数据集来......
2020-7-28 0:4
生成性对抗网络(GAN)是一种神经网络,可以生成与人类生成的内容类似的材料,如图像、音乐、语音或文本。 近几年来,GANS一直是一个活跃的研究课题。Facebook的AI研究总监Yann LeCun称对抗性训练是机器学习领域“过去10年来最有趣的想法”。下面,在实现您自己的两个生成式模型之前,您将了解GAN是如何工作......
2020-7-26 23:3
随着iOS14在WWDC 2020之后的发布,苹果再次更新了其核心ML框架,提供了更丰富的界面,用于在用户设备上培训、运行和微调机器学习模型。在这些改进中,神经网络模型现在可以支持3D卷积和池层,这是许多流行的视频分类模型的骨干。今天,我们将介绍如何采用预先培训的现成视频分类模型,并使其在iOS上运行! 要全面了解今......
2020-7-24 4:10
当我在加州大学伯克利分校(UC Berkeley)完成计算机系统博士论文时,我经常想知道人工智能世界的生活是什么样子。我的人工智能朋友们不断吹嘘深度学习将如何彻底改变从医学到网购的一切-他们的论文一发布就获得了100个引文(见鬼!)。但我一直在想,他们实际上是如何使用人工智能来解决真正的问题的。 与此同时,我最近注意......
2020-7-22 23:35
2020年是机器学习的分水岭之年。它见证了商品化机器学习的真正到来,互联网用户可以很容易地获得深度学习模型和算法。GPU比以往任何时候都更便宜,更容易获得,新的训练方法,如转移学习,使得使用更小的数据集训练强大的深度学习模型成为可能。 但可访问性机器学习也有其不利之处。《纽约时报》克什米尔·希尔(Kashmir Hi......
2020-7-20 19:48
预先训练的模型是其他人为解决类似问题而创建的模型。我们可以使用在其他问题上训练的模型作为起点,而不是从头开始建立模型来解决类似的问题。在您的应用程序中,预先训练的模型可能不是100%准确。 这是用于音频生成的WaveNet生成性神经网络结构的TensorFlow实现。 特拉维夫大学深度学习(深度神经网络)和声音处理领......
2020-7-19 23:44
虽然机器学习可能会成为一种强大的医疗工具,但统计学家警告说,目前的模型存在严重缺陷。 多年来,许多人工智能爱好者和研究人员承诺,机器学习将改变现代医学。已经开发了数以千计的算法来诊断癌症、心脏病和精神疾病等疾病。现在,正在训练算法,通过识别肺部CT扫描和X射线图像中的模式来检测新冠肺炎。 这些模型中的许多旨在预测哪些......
2020-7-16 10:20
刘易斯·史密斯,2020年7月10日我最近写了一篇关于胶囊网络的全概率版本的论文。在试图让这类模型发挥作用时,我发现胶囊网络背后的想法存在一些有趣的概念性问题。其中一些问题本质上有点哲学性质,我还没有想出一个好办法来把它们固定在ML会议论文中。但我认为,当我们设计新的概率视觉模型时,它们可以为研究提供信息(它们非常有......
2020-7-15 5:4
语言建模的最新进展导致了计算密集型和资源需求最高的模型。为了实现可持续的实践,我们引入了LEPEPETT:一个小小的法语模型。 在这个故事中,我们还将讨论为什么需要紧凑的模型,并在法语问答数据集(FQuAD)和跨语言情感(CLS)数据集上评估Lepett。 如果您正在寻找更深入的分析,我们将很快发布一篇关于预训练数据......
2020-7-15 2:24
作为我们去年12月宣布的PyTorch/OpenMines赠款的一部分,Web&;Mobile团队一直在努力开发4个用于静态联合学习的新库: 作为额外的好处:我们还发布了PySyft项目中的第四个Worker库,即PySyft FL Worker,它允许在任何Python环境中进行联合学习。 联合学习的核心是将......
2020-7-13 14:17
监督学习是处理函数逼近的机器学习分支:利用未知目标函数生成的多个输入输出对,构造一个逼近目标函数的不同函数。例如,目标函数可能是我个人的电影喜好,我们可能对获得一个模型感兴趣,该模型可以预测(大约)我会有多喜欢看某部新电影。有了这样的模型,我们就可以创建一个电影推荐应用程序。 有些函数可能比其他函数更容易逼近(给出了......
2020-7-6 16:29
Epoxy使用弱监督和预先训练的嵌入来创建模型,该模型可以以编程交互速度(小于1/2秒)进行训练,但可以保持训练深度网络的性能。该存储库为Epoxy提供了一个简单的概念验证实现(我们的实现大约是100LOC,包括文档字符串)。 在弱监管下,用户编写为数据生成标签的噪声标签函数。从历史上看,我们观察到这些标签函数通常精......
2020-7-2 9:5
下载PDF摘要:在许多拥有大量训练数据和计算的真实世界机器学习应用程序中,神经网络缩放对于提高模型质量至关重要。虽然这种扩展趋势被肯定是提高模型质量的必经之路,但在这条道路上也存在一些挑战,如计算成本、编程简易性和在并行设备上的有效实施。GShard是一个模块,由一组轻量级注释API和XLA编译器的扩展组成。它提供了......
Customer churn prediction(beta.deepnote.com)
2020-7-1 6:34
客户流失是指当客户在一段时间内离开某项服务时,对业务不利的情况。这项工作的目标是建立一个机器学习模型来预测哪些客户会离开该服务,所使用的数据集是位于Kaggle的电信客户流失数据集。为了更好地理解这些数据,我们进行了探索性的数据分析。另一项工作是使用Deepnote作为开发环境,使用PyCaret Python模块创......
2020-6-25 3:17
人类已知了亿万年的物质的突然、彻底的转变,就像水冻结和在火上蒸汤一样,一直是神秘的,直到20世纪。科学家们观察到,物质通常是逐渐变化的:将原子集合稍微加热一下,它就会稍微膨胀一点。但是,将一种材料推过临界点,它就完全变成了另一种东西。 破解“相变”的数学钥匙恰好在100年前问世,它改变了自然科学。众所周知,伊辛模型最......
2020-6-21 12:52
新冠肺炎的迅速传播表明了快速有效的药物发现的迫切需要。药物再利用是一种将现有药物用于新的治疗适应症的药物发现范式。与从头开始的药物发现相比,它具有显著减少时间和成本的优点。利用知识图进行药物再利用为新冠肺炎的治疗提供了一种很有前途的策略。 知识图描述现实世界实体之间的已知关系,并允许发现新的关系。它们是药物再利用的理......
2020-6-8 13:50
用JavaScript开发ML模型,在浏览器或Node.js中直接使用ML。 使用现成的JavaScript模型或转换Python TensorFlow模型以在浏览器或Node.js下运行。
2020-6-8 2:33
蜂鸟是一个用于将经过训练的传统ML模型编译成张量计算的库。蜂鸟允许用户无缝地利用神经网络框架(如PyTorch)来加速传统ML模型。多亏了蜂鸟,用户可以从以下方面受益:(1)在神经网络框架中实施的所有当前和未来的优化;(2)本地硬件加速;(3)拥有支持传统和神经网络模型的独特平台;以及(4)无需重新设计他们的模型。 ......