第24天代码的出现：集合计算

2022-02-19 00:01:15

《代码的出现》第24天天真地涉及到实现一台机器，它实现了一种假想的汇编语言，并将一个程序作为谜题输入。然后必须执行9^14次，以搜索产生特定结果的最低和最高程序输入。

将其实现为解释器在计算上是不可行的。我做这件事是第一次，执行这件事几乎需要100年的挂钟时间。

查看第24天Code subreddit发布的解决方案，有多种解决方案，包括：

我的解决方案是修改我的解释器，使其能够处理集合，并行搜索多种可能性。它和我看到的都不一样，所以我想把它写在这里。

首先，让我们看看指定ALU的解释器。未显示解析指令的步骤。例如"；mul x 0和#34；字符串被转换为Clojure表示形式[：mul:x 0]。

defn machine[input]{:memory{:x0:y0:z0:w0}:input-input}（def machine ops{:mul*：add+:div（fn[ab]（int（/ab））：mod mod:eql（fn[ab]（if（=ab）10））（defn advanced[machine instr]（让[abc]instr获得val（fn[v]（if（关键字？v）（进入机器[：内存v]））））]（if:inpa）（>；machine）（在[:memory b]中关联（第一个（：input machine））（更新：input rest））（在机器[:memory b]中关联）（机器操作a）（获取值b）（获取值c‘‘‘‘‘）’）（defn运行程序[machine instrs]（减少高级机器指令））

AdvancedFunction接受一台机器和一条指令，并返回一台由该指令推进的新机器。run PROGRAME（运行程序）功能通过一系列指令来减少机器。

从这里，可以修改naive解释器，使其对整数集而不是整数集进行操作。

当对两个集合（例如（+a b）执行操作时，结果是一个集合，其中包含应用于a的任何成员和b的任何成员的每个可能值。这是两个集合之间的笛卡尔运算。

;; 在Clojure记数法中，集合A+集合B，每个集合包含1，2和3（+#{1,2,3}{1,2,3}）；；[A0+B0，A0+B1，A0+B2]，[A1+B0，A1+B1，…=>；[2 3 4][3 4 5][4 5 6]；；所有可能性都连接在一起=>；[ 2 3 4 3 4 5 4 5 6] ;; 最后，他们'；重新放置在一个集合中，这将删除重复项=>#{2 3 4 5 6}（*{1 2 3}{0}）=>；[0][0][0]=>；[0]=>#{0}（#{1 2}{0 1 3}）=>；[[0 1 0][0 0]=>；[0 1 0 0 0]=>#{ 0 1}

这样做的目的是通过固定一些输入，让其他输入浮动，从而并行地剔除搜索空间的大部分。

想象一下，我们正在寻找a+b+c+d=35，其中每个都在1-9之间，包括1-9。

（+#{1}；a#{1 2 3 4 5 6 7 8 9}；b#{1 2 3 4 5 6 7 8 9}；c#{1 2 3 4 5 6 7 8 9}）；d=>#{ 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28}

假阳性是可能的。笛卡尔积对变量之间的相关性视而不见。例如，（-x x），其中x=#{12}将返回#{1 0 1}，而不是精确地返回#{0}。

然而，假阴性是不可能的。如果在一个集合中找不到所需的结果，则可以保证输入的组合不会产生该结果，并且可以跳过该部分搜索空间。

出处也没有被追踪。你知道可能的结果是什么，但不知道是什么输入导致了这些结果。

机器用内存constaining#{0}初始化，这是封装在集合中的默认初始值。

defn machine[input]{:memory{:x{0}:y}:z{0}:w{0}:input-input}（def machine ops{:mul*：add+:div（fn[ab]（int（/ab））：mod mod mod:eql（fn[ab]（if（=ab）1 0））（defn笛卡尔运算[op-vb]（in#in#for[a]）（for[a]）（for[b]）（instr advanced machine]如果（：inp a）（>；机器（assoc in[：memory b]）（first（：input machine））（update:input rest））（assoc in machine[：memory b]（笛卡尔运算（machine ops a）（get val b）（get val c‘）；）（defn run program[machine instrs]（减少高级机器指令））

程序执行后，测试：zmemory位置是否包含值0。

在最坏的情况下，电视机的尺寸可能会变得非常大，需要一个断路器——但这不是解决第24天问题的必要功能。

现在我们已经建立了一个可以并行搜索输入的解释器，现在是讨论搜索策略的时候了。我们的输入是14位数。输入中的一些数字可能固定为单个值，而其他数字则未知，这与集合#{1 2 3 4 6 7 9}有关。

我将使用符号263XXXXXXXXXX表示一个输入，其中前三位固定为263，其余数字未知。

搜索函数会被传递一个固定号码和自由号码的列表。它会检查第一个自由数的每一个变化，以确定预期结果是否可能。如果是这样，它将该数字设置为固定值，并进一步递归。

（defn search[instrs fixed free]（apply concat（filter identity）（针对[i（first free）]（让[inp（concat fixed[#i}]（rest free））m（运行程序（机器inp）instrs）mem（get in m[：memory:z]）（当（包含？mem 0）（如果（空的话）（rest free））（conj fixed#{i}）（search instrs（conj fixed#{i}）（rest free#）（rest#}）（rest free)))))41

为了并行执行，前三个数字的所有排列都会在线程池中独立检查。从263开始的搜索路径可能如下所示：

在Ryzen 3900X的单核上，测试917xxxxxxxxxxxin无需进一步递归即可表明此模式不会产生任何答案，需要1231ms才能执行。

这将314亿种可能性排除在搜索之外。解释器的初始标量实现大约需要0.1ms来测试单个数字。

这意味着通过set方法排除搜索空间会使我们的速度提高大约250万倍。

前三位有729个可能的值。其中，702人立即被排除在一张支票之外。其他需要递归。

谜题的第一部分要求返回预期结果的最高输入，即91397187145896。这需要75秒的时间来计算，使用所有可用的内核。

谜题的第二部分要求返回预期结果的最低输入，即41178298586991。这需要248秒来计算。

此外，可以搜索整个空间，在3486秒内检索12096个解决方案。

不错。但我们可以做得更好！在下一篇文章中，我们将尝试构建一个编译器，将ALU指令转换为Rust。

https://www.reitzen.com/post/aoc-2021-24/