开发思想变革工具

2021-02-10 01:10:04

现代计算起源神话的一部分是1960年代和1970年代的黄金时代的故事。在这个故事中,有远见的先驱追求了一个梦想,在该梦想中,计算机启用了强大的思考工具,即增强人类智能的工具,例如,道格拉斯·恩格巴特(Douglas Engelbart),《增强人类的智力:概念框架》(1962)。其中一位先驱,艾伦·凯在撰写个人计算机的潜力时,他总结了对这一梦想的乐观态度:“使用它实际上会改变整个文明的思维方式”,Alan Kay,《用户界面:个人观点》(1989)。

这是一个鼓舞人心的梦想,它促成了现代交互式图形,窗口界面,文字处理器等诸多方面。但是回顾起来,很难让人感到失望,因为感觉计算机还没有像语言和写作之类的较旧的思维工具那样具有变革性。如今,在口头上为过去的开创性梦想服务在技术界已经很普遍了。但是,除了怀旧之外,几乎没有坚定的努力去追求变革性的新思维工具的愿景。

我们认为,现在是再次努力实现这一愿景的好时机。在本文中,我们勾画出了一套我们认为可以用来帮助开发具有变革性的新思维工具的想法。在本文的第一部分中,我们描述了我们构建的实验原型系统,这是一种旨在增强人类记忆力的记忆媒体。这是一个正在进行的项目的快照,详细介绍了令人鼓舞的进展以及许多挑战和机遇。在本文的第二部分,我们扩大了重点。我们绘制了其他几个原型系统。我们要解决的问题是:为什么技术行业在开发这种变革性思考工具的愿景时付出了相对较少的努力?

在开幕式中,我们提到了过去的一些有远见的人。除此以外,还可以添加其他许多人,例如伊凡·萨瑟兰(Ivan Sutherland),西摩·帕特(Seymour Papert),瓦纳瓦尔·布什(Vannevar Bush)等。对于这些人来说,在线上有许多当之无愧的崇拜。但是这种崇高的敬畏之情可能会变成对过去不健康的崇敬,因为人们相信巨人曾经在地球上漫游,而今天的工作却较少。是的,这些先驱者做出了令人惊讶的事情,并且可以说,他们的工作方式使工业界和学术界的现代技术专家都无法胜任。但是他们也犯了错误,并且对当今可用的强大想法一无所知。因此,本文两部分的主题是确定以前不知道或没有采取的有力想法。出于这种认识,人们就认为今天有大量机会可供使用。

术语上的一句话:“思考工具”一词既不会从舌头也不会从键盘上滑下来。而且,术语“工具”意味着一定的狭窄。艾伦·凯(Alan Kay)在《艾伦·凯(Alan Kay)》的《用户界面:个人观点》(User Interface:A Personal View,1989)等文章中再次提出争论。一个更强大的目标是开发一种新的思考媒介。诸如Adobe Illustrator之类的媒体与Illustrator所包含的任何单个工具本质上都是不同的。这种媒介创建了一个强大的沉浸式上下文,在该上下文中,用户可以拥有新的思想,这些思想对于他们以前是不可能的。宽松地说,在这种媒介中可能出现的表达思想范围是该媒介中基本客体和行为的新兴属性。如果选择得当,媒体将扩大人类思想的可能范围。

话虽如此,自从艾弗森在1950年代和1960年代的工作以来,“思考工具”一词就得到了广泛使用。在艾弗森的图灵奖演讲中,“思考工具”(1979)可以找到一个解释。顺便提一句,甚至艾弗森(Iverson)确实在描述一种思想媒介,即APL编程语言,而不是狭窄的工具。介绍这个词。因此,我们将使用“思考工具”作为我们的全部用语,同时给予自己探索更广阔范围的许可,并在适当时偶尔使用“中”一词。

让我们从开头谈起这句话,就是改变“整个文明的思想形态”。听起来很荒谬,是一种技术的先声。当然,除了这些变化在人类历史上曾发生过多次:语言的发展,写作的发展以及我们其他最强大的思维工具。而且,无论好坏,计算机在过去60年中确实影响了我们文明的思维方式,而这些变化似乎仅仅是个开始。本文对理解这种变化是如何发生以及仍然有可能做出的贡献很小。

音乐家和喜剧演员马丁·穆尔(Martin Mull)观察到,“写音乐就像在建筑上跳舞”。以类似的方式,在编写思想工具方面存在着内在的不足。在某种程度上说,这种工具成功了,它使您的思维范围超出了使用现有工具(包括编写)所能实现的范围。工具的转换性越强,打开的间隙就越大。相反,差距越大,新工具在书面上引起的困难就越大。但是写作可以做什么,以及我们写这篇文章的原因,是作为引导。这是一种识别杠杆作用点的方法,可以帮助开发新的思考工具。因此,让我们继续吧。

很少有人比量子计算和量子力学更难被认为是困难的。的确,流行媒体帐户经常以著名物理学家的名言回避(并恐吓)读者:“任何认为自己已经了解量子力学的人都没有理解量子力学”。

是什么使这些科目很难?实际上,对于具有技术背景的人来说,许多基本思想并不太复杂。但是,这些想法以压倒性的数量出现,是不熟悉的概念和符号引起的海啸。人们必须快速连续地学习qubit,bra-ket表示法,Hadamard门,受控非门以及许多其他许多抽象的,不熟悉的概念。他们正在吸收一种全新的语言。即使他们可以一开始就能理解,但要理解以后的想法就需要与所有先前的想法保持流利。它势不可挡,最终令人沮丧。

作为实验,我们建立了一个名为“量子国家”的网站,该网站探索了一种解释量子计算和量子力学的新方法。表面上看,《量子国家》似乎是这些主题的常规论文介绍。与其他任何技术文章一样,这里有文字,解释和方程式。摘录:

但这不是常规论文。相反,量子国家是一种新型助记符介质的原型。理想地,助记符媒介使用户记住他们阅读的内容几乎毫不费力。这听起来像是不可能的愿望。似乎有道理的是,认知科学家对人类如何存储长期记忆的知识相当了解。确实,他们所知道的几乎可以被提炼成可行的配方:按照以下步骤进行操作,您就可以记住所选择的内容。

不幸的是,现有媒体对这些步骤的支持很差。有关此论点的更多信息,请参见Andy Matuschak,《为什么书不起作用》(2019年)。是否有可能设计一种更积极地支持记忆的新媒体?也就是说,该介质将内置(理想情况下毫不费力)存储器中涉及的关键步骤。如果我们能够做到这一点,那么助记符介质将使记忆成为一种选择,而不是偶然的记忆,而是偶然的。当然,就其本身而言,学习量子力学和量子计算等学科并不容易-学习这些学科远不止记忆。但这将有助于解决一个核心难题:数量众多的新概念和符号。

实际上,有很多方法可以重新设计论文媒体。在向您展示我们的原型之前,请暂停片刻并考虑以下问题:如何建立一种媒介来更好地支持人们对他们所读内容的记忆?哪些互动可以轻松愉快地帮助人们巩固记忆?而且,更广泛地说:人们记忆的可能性是原来的两倍吗? 10倍?这会对其有效性产生长期影响吗?

让我们来概述一下Quantum Country的用户体验。在撰写本文时,该站点包含三篇助记符文章(即助记符介质的特定实例)。我们将着重介绍性文章“非常好奇的量子计算”。在本文的正文中嵌入了有关该文本的112个问题。要求用户创建一个帐户,并在阅读是否记住这些问题的答案时进行询问。这是用户回答三个问题时的交互效果。

请注意,这种交互作用发生在论文本身的文本内。这是一个放大的视图,因此您可以在上方和下方看到这些问题如何被论文文字包围:

当然,对于长期记忆来说,仅凭一次召回就无法对用户进行一次测试。取而代之的是,在初次阅读文章几天后,用户收到一封电子邮件,要求他们登录评论会话。在该审核会话中,它们以与上面所示类似的方式再次进行了测试。然后,通过在以后的几天和几周中反复进行复习,人们将对这些问题的答案整合到他们的长期记忆中。

到目前为止,这似乎只是一篇整合了老式抽认卡的论文。但是请注意卡底部指示的时间间隔:

突出显示的时间间隔是直到用户再次测试该问题为止的持续时间。问题以“文本”时间间隔开始,这意味着用户在阅读文章时正在接受测试。如果用户记得问题的答案,则该时间将增加到五天。然后,每次成功审核的时间间隔会持续增加,从五天增加到两周,然后是一个月,依此类推。仅进行了五次成功审核后,间隔时间为四个月。如果用户在任何时候都不记得,则时间间隔会下降一个级别,例如从两周降至五天。

这利用了有关人类记忆的基本事实:随着我们对一个问题进行反复测试,我们对答案的记忆会增强,并且我们可能会保留更长的时间。关于这种影响的文献很多。一个有用的条目是:Gwern Branwen,“高效学习的间隔重复”。这种指数级的上升也许看起来是无害的,但它具有变革性。这意味着相对较少的评论将使用户能够记住多年。复查一个典型问题所需的时间只有几秒钟,这意味着用户可以在不超过几分钟的时间内实现长期召回。工作。相比之下,使用常规抽认卡需要花费数小时才能获得相同的耐用性。指数调度效率更高。

尽管对于Quantum Country来说还很早,但我们可以开始看到助记符介质的某些影响。下面的图表显示了针对每个用户的答案保留率,以及助记符文章中每个问题被审阅的次数:

该图需要一些解释。卡片的“证明的保留时间”是指从成功审查该卡片到对该卡片进行事先审查之间的最长时间。更具体一点,考虑重复数6,例如(在水平轴上)。到目前为止,用户已对文章中的所有112个问题进行了6次复习。纵轴显示了展示的总保留量,将其汇总到所有卡片上,每个蓝色圆点表示达到重复次数6的单个用户。

因此,例如,在重复6次之后,我们从图表中看到,大多数用户的展示保留期约为6,000天。这意味着每个问题中平均每个问题大约需要6,000 / 112〜54天。凭直觉看,这似乎很不错–如果您像我们一样,在阅读某些内容几个月后,您的记忆只会变得朦胧。相比之下,这些用户以较低的时间成本(其中包括更多费用)在112个详细问题上实现了近两个月的保留。

此外,您还可以看到保留次数随着卡片查看次数的增加而呈指数增长。第一次审核后,每张卡的用户通常显示的保留期平均仅为2天以上。考虑到我们之前提到的第一次审核间隔为5天,特别小心的读者可能会想知道这是怎么可能的。原因是我们最近修改了审查时间表,因此第一次审查是在5天之后。在Quantum Country的大多数历史记录中,审查计划较为保守,这就是造成这种差异的原因。但是到第六次审查时,证明保留的平均时间为54天。通常,这需要大约95分钟的总审核时间。鉴于论文大约需要4个小时的阅读时间,这表明少于50%的时间投入可以为论文中的几乎所有重要细节提供多个月或数年的保留。

这是间隔重复的最大的,违反直觉的优势:您将获得成倍的回报,以增加工作量。平均而言,每多花一分钟的时间进行审核就会带来越来越多的收益。这与生活中的大多数经验形成了鲜明的对比,在这些经验中,我们遇到了收益递减的问题。例如,通常,如果您将花费的阅读时间增加了50%,那么您期望得到的额外收入不会超过50%,甚至可能更少。但是使用助记符介质时,您将花费的阅读时间增加了50%,则可能会得到10倍的收益。当然,从字面上看我们并不是很确切的意思。但这确实传达了获得强烈非线性收益的关键思想。这是介质质量的变化。

这种延迟的利益使助记符介质在多种方面变得异常。另一个是这样:大多数在线媒体使用短期参与模型,通过操作条件的变化来驱动用户行为。这是通过Twitter,Facebook,Instagram和许多其他流行的媒体形式完成的。助记符媒体更像是冥想-在某些方面是反产品,因为它违反了很多传统的硅谷智慧-带来的好处是延误了,很难立即意识到。确实,使用助记符介质时,延迟越大,收益越多。

这些是初步结果,需要进一步调查。人们自然地想知道,如果我们对审查时间表更加积极,将两次审查之间的初始间隔设置为(例如)2个月,该怎么办?如果用户可靠地保留了该点之前的信息,则该图将开始变得很高,并且我们将看不到指数。我们需要调查这些以及许多类似的问题,以便更好地了解用户记忆的状况。

用户的早期反馈使我们对他们发现助记符介质有用的情况持谨慎乐观的态度。 2019年5月,我们中的一个人在Twitter上发布了一条短线,解释了量子隐形传态如何工作的技术细节。量子国家的一位用户回复了该主题:

我(到目前为止)只完成了您的第一本量子国家课程,但是我发现自己可以理解并遵循证明,并且知道一切意味着什么,这真是太好了。就像《黑客帝国》中的Neo告诉Morpheus一样,“我知道量子计算”。在电影《黑客帝国》中,一个人物(Neo)使用计算机非常迅速地将武术技能上传到他的脑海中。完成上传后,他睁开眼睛告诉另一个角色(Morpheus):“我知道功夫”。

我拥有量子信息/计算博士学位,在阅读之前我已经了解了本文中的所有内容,但是通过使用给定的间隔重复抽认卡获得的额外理解大大提高了我对材料的理解。每个正在阅读本文的人都应该注册并尝试重复进行。

量子计算的新用户,另一位用户告诉我们,“量子国家”是迄今为止我所能想到的引入这种材料的最佳方式。当我们询问他如何使用所学的知识时,他解释说,当他公司的一位访客举办了一次有关量子计算的技术研讨会时,他预计会在10分钟后迷路。代替:

哇,我实际上跟踪了40或45分钟,因为矩阵看起来很熟悉……[中等意思]您一遍又一遍地遇到了概念……它提供了更有效的抽象层次上的交互。

站点分析表明,不断有大量人员按我们预期的方式稳定地进行审核。原型发布六个月后,有195位用户证明了论文中至少80%的卡片保留了整整一个月的时间,这表明我们对该流程的承诺水平非同寻常,我们并未尝试过扩展该流程出来。考虑一下这是很有趣的。我们还没有一个很好的模型来准确地了解这些人正在学习什么,但是看来他们比传统论文甚至从传统论文中获得的收益更多来自常规课程。

当然,这种反馈和这类结果应该花些力气。助记符介质尚处于早期阶段,存在许多缺陷,并且需要以多种方式进行改进(其中更快)。但是,令人鼓舞的是,听到一些用户已经发现该介质特别有用,并建议进一步开发和测试该介质。至少,助记符媒介似乎确实可以真正帮助人们记住。而且,它具有如上所述的成倍增加的效率:学习的人越多,他们每分钟学习所获得的利益就越多。

在另一个非正式实验中,我们试图找出当不要求用户查看卡片时,它对用户的记忆有多大影响。为此,我们为8张卡的一小部分引入了故意的(两周)短暂的审核延迟。也就是说,某些用户在初次阅读时会审阅这8张卡,然后至少两周无法再次审阅它们。其他用户将继续照常学习8张卡片。通过比较两组,我们可以估算出查看卡片对用户记忆的影响。

发生了什么事?好吧,对于那些评论被延迟的用户,准确性从91%(最初阅读时)下降到87%(两周后)。这似乎是一个很小的下降,但是请记住,用户继续查看其他卡,几乎可以肯定它们的最终性能有所提高,因为这些其他卡的内容与延迟的卡有所重叠。如果不延迟所有卡片的评论,就很难避免这种重叠,这是用户体验上比我们想要施加的更为剧烈的变化。对于要求正常检查卡片的用户,准确性从89%提高到96%。简短的摘要是:当用户不检查卡片时,准确性下降了4%;当他们对卡片进行审核时,准确性提高了7%。更详细地说:该小组中的16位用户通常进行审核,而该组中的25位用户延迟了审核。 95%的置信区间为:91±4%,87±5%,89±5%,96±3%,假设每个变量都是二项式的,独立的且分布均匀。后一个假设是近似的,因为我们期望一些用户-

......