今天,我很兴奋地与乔尔·斯波尔斯基和裘德·奥尔雷德一起介绍哈希公司,这是我们一年多前创立的公司。我们认为,世界上大多数坏事都是某种形式的信息失灵的产物。从经济崩溃、战争和疾病的爆发,到选择正确的人生伴侣或大学学位,我们的使命是帮助每个人做出正确的决定,克服信息失灵。
才华横溢的创新者寻求组织世界上的信息并使其为所有人所访问,而这一旅程的下一步是使这些信息为每个人所理解和使用。
虽然像对冲基金这样的高科技、资金雄厚的组织能够高效地处理世界上大量的信息,在经济交易中获得微小的收益和毫秒的优势,但绝大多数企业和个人没有系统的方法来分析他们周围世界包含的丰富信号。
模拟有能力打开一个更美好的世界:促进我们对周围世界的理解和欣赏。模拟不仅是人类有用的认知工具,而且有可能成为丰富的、机器可读的真实世界问题的表现形式。因此,它们是人类和人工智能的通用接口-在我们看来,这是我们生长连接人类和机器学习的结缔组织的最好机会。
我们希望能够实现更好的人性化和自动化决策:合理解决冲突,减少和消除市场失灵,并支持人们实现更幸福、更健康的生活。我们不想等这个。
我曾在伦敦经营一家数字咨询公司,为范围广泛的客户开发网站、软件和开展数据驱动的活动:从私募股权公司和初创公司到规模最大的政府客户。
我们时不时会遇到一些非常有趣的问题,比如如何跟踪行为驱动的疾病(如性传播感染)的传播,评估针对它的干预措施的有效性(例如,信息性广告宣传),以及优化广告支出(即,瞄准最有可能阻止疾病传播的网络中的有影响力的节点)。
事实证明,在流行病学和行为广告中,回答这些类型的问题都存在一个黄金标准,那就是“基于代理的建模”(ABM)。作业成本管理系统的工作方式如下…
代理人代表行为者:无论他们是个人、公司、家庭、工厂里的机器,还是其他任何东西。不同的模型以不同的粒度级别查看系统。从理论上讲,“代理人”可能是一个分子。
代理具有属性:这些属性是附加到代理的值,不同的代理之间会有所不同。就个人而言,财产可能是布尔型的,如“是已登记选民”(Y/N)、“政党关系”(多项选择)或“年收入”(某个数值)。
代理存在于环境中(通常是同时存在多个),例如地理空间上和网络图上。
代理是由行为驱动的:行为本质上是解释代理应该如何与周围世界交互并对其做出反应的代码。
ABM可以从基本的第一原则开始构建,并且对于反事实的“假设”假设测试非常有用,从而能够安全地探索现实世界系统的数字孪生兄弟。这使得多智能体模拟比通过网络预测疾病和信息的传播更有用。
一系列复杂的系统问题都无法进行可预测的建模。这些都是典型的问题,根据非线性、涌现、适应、相互依赖和代理之间的反馈循环进行分类。根据定义,由此产生的“黑天鹅事件”没有反映在现有的模式和历史数据中,因此完全被遗漏了。
没有系统是真正孤立存在的-所有系统都是我们复杂的现实世界的一部分-因此,所有的业务、政策和人的问题最终都是理解复杂系统的问题。智能抽象使我们能够在大多数情况下忽略大多数无关的世界,但是很难知道在什么时候、在什么情况下,什么可能是有趣的。
在一些制度中,这并不重要,但在回答其他问题时,比如我们如何才能为更稳定的经济或良好的外交关系做出贡献,它们可能是生死攸关的问题。为了充分理解这些高影响、高风险的问题,我们需要基于这些系统的可观测动力学来生成性地搜索它们周围的空间。仅对历史输出进行模式识别和分析对于廉价的基础套管来说是有好处的,但对问题的尾部了解甚少。
因为代表世界所有可能形态的问题周围的空间比观察到问题的历史空间大得多,所以有时会有一种诱惑,认为适当的科学模拟是不可行的。但是,正确使用模拟并不是试图模拟世界上可能发生的每一个可能的版本(当然是无限的),而是帮助它的用户理解哪些版本可能会发生,并将注意力吸引到可能的新颖场景上,而这些场景可能是人类分析家以前可能没有发生过的,因为它们的出现性质。
像07/08年金融危机这样的危机之所以成为灾难,恰恰是因为决策者没有理解或解释复杂系统的潜在动态-在这种情况下是经济。巴塞尔协议II(Basel II)等善意的监管措施实施了资本储备要求,当与按市值计价的会计做法相结合时,这导致了资产大甩卖,市场参与者被迫在下跌的市场抛售,加深了低谷。
虽然历史和现值数据可以用于预先填充和回测基于代理的模型;但不需要构建ABM,这为在当今机器学习不容易应用的各种领域中的显式形式化建模打开了大门。
此外,仿真结合了形式建模的优点和定性描述的丰富性,使得它们具有高度的可解释性,并且易于被人类理解。与通常的黑盒模型不同,基于代理的模拟本质上是可检查的,用户可以逐步通过时间来确切地查看结果是如何得出的,以及哪些因素起作用。
模拟既耗时又昂贵,而且维护、运行和支持也很昂贵。它们需要专业工具、框架,甚至奇怪的专有编程语言的知识。由此产生的模拟通常不是特别便携或可重用的,并且在模拟逻辑是猜想的产物或缺乏校准的情况下,这可能导致错误的信任感或安全感,这可能会加剧现有的不良决策。
尽管仿真声称供应链、制造、金融、国防等领域的杰出用户,但目前市场领先的基于代理的建模软件包的价格超过10K美元/用户/年,并且基于过时的技术和范例,不能很好地应用于实际规模的分布式计算。他们的用户界面自20世纪90年代以来就没有人碰过,他们提供的开发体验也同样过时,他们根本不在浏览器中运行,不能在移动设备上使用,用户经常需要部署特殊的软件才能访问它们。
在大多数情况下,这些模拟都是玩具模型,旨在展示特定的动态,并且缺乏互操作性。一旦建成,模型就是孤立的,很少共享或建立在他人工作的基础上。大多数建立的模型的范围都很小,以确保它们以及时的方式运行,以至于它们只捕捉到了它们所代表的系统中的一小部分动态。不是在每个实验的基础上构建丰富的虚拟世界并有选择地包括相关部件,而是创建廉价的玩具抽象概念,这些抽象概念无法激发用户的信心,而且更不容易探索。对于玩具模型是否真的是“科学的”,存在着深刻的、合理的怀疑,另一方面,更复杂的模型是否可以进行适当的校准和参数化,也存在着深刻的、合理的怀疑。
再加上寻找适当粒度的代理级数据的问题,将领域专业知识转换为代码的困难,以及创建ABM的一系列结构性障碍,不难理解为什么通用模拟仍然不受欢迎,在今天的业务中很少使用。
当面临很多系统性问题时,我们想要构建系统级的解决方案。Hash旨在通过垂直集成整个堆栈来“解决仿真”,为构建、运行和学习仿真提供统一的平台。
所有散列模拟都由代理(由描述性架构表示)和行为(通常是纯函数)组成。行为驱动代理,数据集可用于在基于真实世界观察的模拟中实例化或更新代理,或用于回测和校准模型。行为和数据集被映射到适当的主题和模式,使得建模者可以使用H-Index很容易地发现它们,并且将来可以在H-Core中交叉链接。
仿真、数据集和行为都可以在H-Index上访问。今天,H指数中的一切都是免费的。被设想为GitHub和包管理器之间的交叉,在未来,H-Index将被扩展为另外一个市场,促进付费行为、数据集和模拟的购买和销售。我们设想咨询公司免费发布组件以建立信誉和专业知识,然后销售更完整的模拟和咨询服务。
我们对H-Index的未来计划包括对分叉、分支、报告问题和发出Pull请求的显式Git支持-这些功能,就像使用包管理器一样,现在是大多数软件开发人员的第二天性。
这些变化对开发人员工作流程的影响是巨大的:随着H-Index的发展,具有有限编程知识的领域专家将能够分叉和调整,或者将现有行为大规模合并到模拟中,使他们能够对复杂的动态进行建模,而无需从头开始编写大量自定义代码。
然而,我们目前的阵容并不完整。虽然我们惊人的快速散列引擎能够以无与伦比的速度进行模拟,但它目前只能通过基于Web的H-Core IDE提供,这必然会将其限制在浏览器选项卡可用的内存和CPU上,而在许多情况下,浏览器选项卡的可用内存和CPU是非常有限的。这意味着,虽然H-Engine旨在处理真正世界大小的模拟,但我们的早期测试版用户仅限于在我们的平台上构建相对较小的模型。这使得H-Core在目前的迭代中可以与NetLogo之类的基于代理的学术建模工具相媲美:有助于说明复杂系统中不同代理的影响,并有助于向用户解释这些系统的动态,但其对高保真或大规模建模现实世界环境的能力有限。由于目前的这些限制,用于运行优化实验(参数扫描、蒙特卡罗模拟和更奇特的强化学习)的工具暂时被隐藏起来-但对我们来说是非常优先的。
为此,今天我们将发布我们的路线图,以解锁这些功能,并将模拟用于日常的“现实世界”决策:
Hash Core和Hash Index现在都是正式的测试版。在接下来的几周里,我们将在这两个平台上大量迭代,并欢迎您的意见
我们很自豪地宣布,我们将在今年晚些时候成为开源散列引擎,这是散列核心的模拟引擎。H-Engine是用Rust编写的,目前已有JavaScript和Python的绑定,它是支撑所有散列计算的超快参与者系统。
我们的目标是让每个人都能访问这个平台,使人们能够在本地和封闭的系统中运行H-Engine是这一目标的重要组成部分。
我们目前的目标是在2020年底之前在开源许可下发布H-Engine的公共版本。
今年,我们还将开始推出hash Cloud,以选择测试版用户。H-Cloud是我们平台的一部分,用户只需在Hash现有的H-Core创作和查看界面中点击一下,即可在云中运行模拟(也可以通过命令行在H-Engine开源启动时运行)。
除此之外,我们还将在H-Core中展示一个“实验”界面,它可以打开从大规模模拟中获得商业洞察力的大门。
通过H-Cloud,用户将能够以编程方式访问模拟和实验结果,以驱动散列之外的算法和应用程序。
一年多前,我们刚开始只有两个人,现在是一个大约10人的团队。我为我们建立的团队以及我们在这段时间取得的成就感到难以置信的自豪。
我们很高兴能与hash的用户见面,并推出了一个Slake社区,您可以通过hash.ai任何页面右下角的图标访问该社区。我们将随时帮助您构建模型,回答您的问题,并获取您的功能建议和错误报告。
我们正在努力使hash更容易访问,并将支持扩展到尽可能广泛的开发人员。Rust引擎具有针对Python和JavaScript的绑定,但到目前为止,在H-Core中的创作行为仅限于后者。今天,我们很自豪地宣布,通过H-Core在浏览器中本地支持Python行为创作和模拟运行。多亏了Mozilla令人惊叹的Pyodide项目,我们能够将对Python的试验性支持带到我们基于浏览器的H-Core IDE中,虽然目前它带来了很大的性能冲击,但我们希望在H-Cloud和H-Engine完全推出之前,我们能够在许多方面改进这一点(这两种技术都将允许用户避免任何性能损失)。开发人员现在可以使用Python以散列形式构建模型,并导入任意数量的流行科学Python包(更多信息请参阅我们的文档)。
为了消除信息故障,我们需要构建以前从未创建过的工具来解决今天无法解决的问题。我们需要赋予人们超能力,这就是我们肩负的使命。
如果您想使用hash构建模型,您可以在hash.ai/signup上注册。
如果您想加入我们帮助每个人做出正确决策的使命,您可以帮助将模拟、行为和数据发布到H-Index,或者申请我们在hash.ai/areers上的任何一个公开职位。
最后,如果您是一位对了解如何应用HASH来帮助您感兴趣的商业决策者,请访问hash.ai/Contact我们感谢Hash的早期投资者的支持:令人惊叹的社区创建者,如Stack Overflow创始人Joel Spolsky、Kaggle创始人Anthony Goldbloom,以及来自Zetta Venture Partners和Root Ventures的Ash Fontana和Lee Edwards。我们很高兴能开始我们的公共使命。