rubiks-cube - 如何创建用于解决魔方的模式数据库？

我已经实现了Korf的算法，您可以将我的代码用作参考：https://github.com/benbotto/rubiks-cube-cracker/这是很多代码，本文中没有太多内容，但是我可以提供一些一般的算法技巧。

首先，Korf的论文建议使用三个模式数据库，而不仅仅是一个。其中一个数据库存储解决任何多维数据集的角点所需的移动次数。有8个角球室，每个都可以占据8个位置中的任何一个，所以有8个！可能的排列。每个角块可以以3种不同的方式定向-例如，三个贴纸中的任何一个都可以面朝上-但7个立方体的方向决定了第8个立方体的方向（根据立方体的定律）。因此，有3 ^ 7种可能的方式可以确定角的方向。那么一共有8个！ * 3 ^ 7种可能的方式可以扰乱多维数据集的角，并且可以在合理的时间量（约30分钟）内迭代这些88,179,840个状态。可以用11个动作或更少的动作达到所有角状态，因此可以将角模式数据库中的每个条目存储在半字节（4位）中。在磁盘上，角落模式数据库大约占用42MB。

可以使用广度优先搜索来填充此数据库。进行移动并使用拐角的状态在数据库中创建索引。如果以前只用较少的动作就可以看到状态，则可以修剪搜索树：没有理由继续沿分支前进；否则，将状态添加到数据库并继续搜索。如上所述，由于在搜索过程中可以进行大量修剪，因此在现代计算机上迭代所有可能的角状态不会花费很长时间。

我的广度优先搜索算法：https://github.com/benbotto/rubiks-cube-cracker/blob/master/Controller/Searcher/BreadthFirstCubeSearcher.cpp
我的角落模式数据库：https://github.com/benbotto/rubiks-cube-cracker/blob/master/Model/PatternDatabase/Korf/CornerPatternDatabase.cpp
在这里我为角落数据库建立索引：https://github.com/benbotto/rubiks-cube-cracker/blob/master/Controller/Command/Solver/KorfCubeSolver.cpp#L30

Korf建议使用另外两个数据库：一个用于12个边缘中的6个，另一个用于其他6个边缘。 Korf使用的硬件有限（Sun SPARC Ultra！），但是由于我使用的是更现代的计算机，因此我选择在每个边缘数据库中使用7个边缘。这大大加快了求解器的速度。无论如何，7个边缘可以占据12个位置，因此有12P7（12！/（12-7）！）排列。每个角可以2种方式定向，因此7个边缘有2 ^ 7个可能的定向。同样，这是要迭代的足够少的多维数据集状态，并且所有状态都可以在10步或更短的时间内到达。将每个条目存储在半字节中，每个7个边缘数据库占用约244MB（12P7 * 2 ^ 7/2字节）。

出于效率方面的考虑（出于效率考虑，我使用非递归算法实现了广度优先搜索）。尽管这种类型的搜索对于构建角落数据库很好，但是对于索引边缘数据库而言，内存成本过高。因此，我使用了自定义的迭代加深深度优先搜索来索引边缘。 “自定义”部分是在达到已遇到的状态时提早退出。

我的自定义IDDFS实现：https://github.com/benbotto/rubiks-cube-cracker/blob/master/Controller/Searcher/PatternDatabaseIndexer.cpp
我的各种边缘模式数据库：https://github.com/benbotto/rubiks-cube-cracker/tree/master/Model/PatternDatabase/Korf

以上磁盘上数据库的大小当然是假设该数据库只包含到达每种状态的移动次数，每个移动存储在半字节中。也就是说，数据库是一个哈希表，每个状态都是该表的索引。因此，您需要一种“完美的哈希”算法，该算法需要对多维数据集进行排列并返回索引。在他的论文中，他有多本关于组合拼图的论文，Korf对于如何创建这样的哈希非常简洁。归结为计算Lehmer codes。 Korf在他的论文Large-Scale Parallel Breadth-First Search中给出了一种简短的线性算法。

我们从左到右扫描排列，构建了一个长度为n的位串，表示到目前为止所见的排列的哪些元素。最初，字符串全为零。当遇到排列的每个元素时，我们使用将其作为位串的索引，并将相应的位设置为1。当我们在置换中遇到元素k时，要确定左边小于k的元素数，我们需要知道位串的前k个位中的元素数。我们通过将字符串右移n-k来提取前k位。这样可以减少问题：给定一个位串，计算其中的一位数。

我们通过使用位字符串作为预计算表的索引来固定时间解决此问题，该表包含每个索引的二进制表示形式中的个数。

我花了很长时间才将其消化并将其转换为代码，特别是因为他没有谈论索引部分排列。生成边缘片段的模式数据库时，您需要索引部分排列，因为创建包含所有12条边缘的数据库将非常庞大。因此，我在Medium上写了一篇关于它的文章：https://medium.com/@benjamin.botto/sequentially-indexing-permutations-a-linear-algorithm-for-computing-lexicographic-rank-a22220ffd6e3

最后，我测试了许多用于存储多维数据集的不同数据结构。在我的代码中，我有多个求解器（Korf和Thisthlewaite）以及图形表示。我实际上将多维数据集存储在4种不同的结构中。使用像Korf一样的算法，用来表示魔方的结构会对求解器的速度产生很大的影响。我在another post中写过关于不同结构的文章，而选择（4）到目前为止是我测试中使用Korf算法最快的。要创建单个数据库条目，您需要每个多维数据集的索引和方向（例如，{0-7，0-2}代表拐角）。因此，在创建模式数据库时，将多维数据集表示为索引和方向非常有效，因此不需要额外的处理即可计算它们。

如何创建用于解决魔方的模式数据库？

1 个答案: