填补谜题博士上周赢得了美国填字游戏剧锦标赛,首次在国民活动中设法突出了人类索盘

2021-05-08 23:12:43

在上周的美国填字游戏舞蹈锦标赛中,作为一个以上1000多名参与者的虚拟活动,一个令人印象深刻的竞争对手。 (而且,尽管我的143分,但遗憾的是,这不是我。)第一次,人工智能设法突出了比赛中的人类索盘,以速度和准确性填充网格。它是填充博士的胜利,一个德语解决自动机,这是争论近十年的碳的十字架论者。

对于一些观察者来说,这可能看起来像是人类努力的另一个领域,其中AI现在有鞋面。填补石板的成就博士报告,奥利弗·罗德德写道,“跳棋,步步高,国际象棋,去,扑克和其他游戏目睹了机器的入侵,逐一落在占主导地位的AIS中。现在填字游客加入了他们。“但看看填充博士的看法,这一壮举揭示了不仅仅是人类和计算机之间的最新斗争。

当IBM的Watson SuperComputer overply Ken Jennings和Brad Rutt在Jeopardy上时!只有10多年前,詹宁斯回应了,“我,一个人,欢迎我们的新电脑霸主。”但詹宁斯代表人性扔进毛巾有点疲惫。然后,目前,最新的AI进步不仅展示了对自然语言的计算理解的潜力,也是它的局限性。在填补博士的情况下,它的表现就像精神武器人一样,在解决填字游戏的特殊语言挑战中,与谜语的奇怪的语言挑战一样多,与设计的灵魂相匹配。事实上,仔细看看一条软件如何试图分解一个恶魔填字游戏,而且在我们用语言玩时,我们的大脑正在做新的洞察力。

填充博士是由一位商品科学家的Matt Ginsberg孵化,该公司也是一个发布的填字游戏构造函数。自2012年以来,他一直在进入ACPT的填写博士,每年对解决软件进行增量改进。然而,今年,GINSBERG与伯克利自然语言处理集团联盟,由UC Berkeley教授丹克莱因的毕业生和本科学生组成。

Klein和他的学生在2月份开始在恳切地上致力于该项目,后来向Ginsberg看看他们是否可以将他们的努力结合在今年的锦标赛中。在ACPT开始前两周后,他们将它们一起攻击了一个混合系统,其中伯克利集团的解释线索的神经网络方法与Ginsberg的代码一起工作,以有效地填写填字游戏网格。

新的和改进的博士填充填充了一系列活动中的网格(您可以在此处看到它)。但实际上,该计划是深入的方法,分析了一个线索并以初始排名的候选人列表答案,然后基于它们与其他答案的符合良好的因素来缩小可能性。正确的响应可以在候选列表中深度掩盖,但足够的上下文可以使其渗透到顶部。

填充博士在过去纵曲中收集的数据培训,这些串联出现在各种插座中。为了解决难题,该程序指的是它已经“看到”的线索和答案。像人类一样,填补博士必须依赖于过去在新的挑战时所学到的东西,寻求新的和旧经验之间的联系。例如,由华尔街日报填字游戏编辑Mike Shenk构建的竞争的第二个难题依赖于长期答案的主题,这些主题 - 添加了形成新的幻想短语,例如鸦片浓度成为鸦片密度(包括“罂粟产品效力的因素?”)。填充博士运气,尽管存在不寻常的短语,但一些答案在2010年在洛杉矶时报发布的类似主题纵横游戏中出现,其中Ginsberg包括超过800万线索和答案的数据库。但锦标赛填字游戏的线索与填充博士仍然挑战出来的正确答案。 (例如,2010年的鸦片密度是在2010年的“邻里药物交通的衡量标准?”)

对于所有答案,无论是拼图的一部分是否存在,该程序是否通过成千上万的可能性来生成最佳匹配线索的候选人,通过可能性排列并检查其网格的约束,例如如何跨越网格的限制下降条目互锁。有时顶级候选者是正确的候选者:例如,对于线索“强加的群体”,例如,填充博士排名正确的答案,阵列作为首选词汇。 “强调”这个词从未出现过以前的消息,但其他同义词,如“令人印象深刻”,允许填充博士来推断语义连接。

交叉字母经常有助于缩小候选人,所以知道第二个字母是o在五个字母的答案中是“哇,这是一个耻辱!”帮助正确的答案,如此悲伤,泡到列表的顶部。

从人工智能和自驾车到改变城市和新初创公司,注册最新消息。

通过注册即表示您同意我们的用户协议和隐私政策& cookie声明

填字游戏求解器是一个封闭的系统 - 它不能只是谷歌答案。结果,其知识库存在差距。在这方面,该计划也模仿了我们自己的不完美的心理能力,即使它的存储和加工速度矮人萎缩人类大脑。 Clue“诗人写的鸡肉猫是快乐,明亮的'(5字母)可能是显而易见的。艾略特,但填补博士最初喜欢KeeSs和Yeats在Eliot领先地位作为诗人。 (由于伯克利团队的线索系统雇用了“黑匣子”方法而不是事实后更具可意识的东西,因此很难说为什么它有利于一个诗人。)

而且事情尤其棘手地与涉及双关语或其他字幕的线索,通常用问号表示。在这个拼图中,潜望镜得到了线索“子标准?”,闪烁着闪烁的博士在第一次猜测的顶部猜测“亚”与三明治有关的“亚”,所以它提出了像金枪鱼一样的候选人。虽然,那些坏的猎人甚至是照明的:伯克利的神经网络系统能够辨别出一种不寻常的事情正在与一个问号线索发生,即使它被困在错误的潜艇上。该计划尚未明确教导一个问号信号某种语义神话人,Klein解释说,但通过机器学习,它可以逐渐推动它需要寻找不太直接的选择,而不是普通线索。

然而,最终,填充博士能够在一分钟内正确地解决填字游戏 - 超过任何人类竞争对手的完整两分钟。但是,与200多名人类求解器不同,它对所有的谜题都不完美:它在其中两个拼图并完成了错误。尽管处罚得分,填充博士的速度速度足以让它在七个谜题之后坚持排行榜的顶部,通过最狭窄的利润率来完成最快的人类竞争对手。

纽约时报填字游戏编辑将于1978年以来的年度锦标赛来缩写,这指出,今年的竞争拼图可能已经发挥给填充优势博士,因为“每个答案都是可以理解的英语阅读左右,左右左右读取的英语阅读。“ (有些年份有邪恶的谜题,这些谜题如何与答案进入网格。)Shortz说他是“在编程中的聪明才智令人敬畏地填补来解决坚韧,有时棘手的填字游戏,”但他认为团队碳仍然有许多方面的边缘。 “现在,人类仍然更好地处理框架,非纵向,真实的世界问题,”他说,指出即使在缺乏额外泄漏水平的谜题,填充仍然可以绊倒甚至可能会绊倒的事实人类永远不会的方式。

虽然比赛到锦标赛记分牌的顶部最受关注,但Ginsberg和Berkeley团队的共同努力可能有其他较少的标题 - 抓住的回报。对于一件事,填充博士可能在未来几年内有清洁的饰面,因为机器学习进展和该计划喂养更多谜题和培训数据。但克莱林看到了许多挑战,经常在自然语言处理领域出现。例如,人类的思想往往导航所谓的“多跳推断”,其中不同的知识位在推理链中组合。教授AI遵循这些逻辑点的跳跃,以人们在可能是倾斜或彻头彻尾的欺骗性的语言中找到意义的微妙方式。同样,正如填充博士的混乱对“亚”线索所证明的那样,其大脑仍然努力识别替代方案,不那么常见的含义。考虑到这条线索的误导,即纽约时代填字游戏,我最近正在合作:“以某种方式”。答案是macabre,因为“国王”在这里是指小说家斯蒂芬国王。如果AI可以弄清楚如何解决这样的线索,我可能会准备好欢迎我们的新电脑霸主。

Klein看到填充博士的表现只是欣赏我们如何从填字游戏线索的最新的兴趣解锁意义的第一步。当谈到特别是狡猾的语言标本,例如涉及推论链的那些,克莱林说“那些树桩的人可能会破坏这种系统。”填字游戏将继续呈现独特的AI挑战,因为他们表明语言不仅仅是直接的沟通。这是一个典型的人类特质,在戏剧中被语言令人愉快。

🏃🏽♀️希望最好的工具健康?查看我们的齿轮队的选择,以获得最佳健身跟踪器,运行齿轮(包括鞋子和袜子)和最好的耳机