为人工智能课程解决问题

时间:2015-10-12 18:50:07

标签: artificial-intelligence dijkstra depth-first-search a-star

所以我得到了以下任务:假设游戏的5x5版本中的所有灯都打开,请使用UCS / A * / BFS / Greedy最佳搜索找到解决方案的算法。

我先做的是意识到UCS是不必要的,因为从一个状态移动到另一个状态的成本是1(按下一个翻转自己和相邻状态的按钮)。所以我所做的就是用BFS写的。事实证明,它工作得太长并且填满了一个队列,即使我在完成它们时不注意去除父节点而不是溢出内存。它会工作大约5-6分钟然后因内存而崩溃。 接下来,我所做的就是编写DFS(尽管它没有被提及作为可能性之一)并且它确实在123秒内找到了解决方案,深度为15(我使用深度优先,因为我知道深度有一个解决方案15)。

我现在想知道的是我错过了什么吗?使用A *搜索尝试解决此问题是否有一些良好的启发式方法?当它是关于启发式的时候我完全没有想到,因为在这个问题中找到一个似乎并不是一件轻而易举的事。

非常感谢。期待你们的帮助

这是我的源代码(我认为这非常简单易懂):

struct state
{
    bool board[25];
    bool clicked[25];
    int cost;
    int h;
    struct state* from;
};

int visited[1<<25];
int dx[5] = {0, 5, -5};
int MAX_DEPTH = 1<<30;
bool found=false;

struct state* MakeStartState()
{
    struct state* noviCvor = new struct state();

    for(int i = 0; i < 25; i++) noviCvor->board[i] = false, noviCvor->clicked[i] = false;
    noviCvor->cost = 0;
    //h=...
    noviCvor->from = NULL;

    return noviCvor;
};

struct state* MakeNextState(struct state* temp, int press_pos)
{
    struct state* noviCvor = new struct state();

    for(int i = 0; i < 25; i++) noviCvor->board[i] = temp->board[i], noviCvor->clicked[i] = temp->clicked[i];
    noviCvor->clicked[press_pos] = true;

    noviCvor->cost = temp->cost + 1;
    //h=...
    noviCvor->from = temp;

    int temp_pos;

    for(int k = 0; k < 3; k++)
    {
        temp_pos = press_pos + dx[k];

        if(temp_pos >= 0 && temp_pos < 25)
        {
            noviCvor->board[temp_pos] = !noviCvor->board[temp_pos];
        }
    }

    if( ((press_pos+1) % 5 != 0) && (press_pos+1) < 25 )
        noviCvor->board[press_pos+1] = !noviCvor->board[press_pos+1];

    if( (press_pos % 5 != 0) && (press_pos-1) >= 0 )
        noviCvor->board[press_pos-1] = !noviCvor->board[press_pos-1];

    return noviCvor;
};

bool CheckFinalState(struct state* temp)
{
    for(int i = 0; i < 25; i++)
    {
        if(!temp->board[i]) return false;
    }

    return true;
}

int bijection_mapping(struct state* temp)
{
    int temp_pow = 1;
    int mapping = 0;

    for(int i = 0; i < 25; i++)
    {
        if(temp->board[i])
            mapping+=temp_pow;

        temp_pow*=2;
    }

    return mapping;
}

void BFS()
{
    queue<struct state*> Q;

    struct state* start = MakeStartState();
    Q.push(start);
    struct state* temp;
    visited[ bijection_mapping(start) ] = 1;

    while(!Q.empty())
    {
        temp = Q.front();
        Q.pop();
        visited[ bijection_mapping(temp) ] = 2;

        for(int i = 0; i < 25; i++)
        {
            if(!temp->clicked[i])
            {
                struct state* next = MakeNextState(temp, i);
                int mapa = bijection_mapping(next);

                if(visited[ mapa ] == 0)
                {
                    if(CheckFinalState(next))
                    {
                        printf("NADJENO RESENJE\n");
                        exit(0);
                    }
                    visited[ mapa ] = 1;
                    Q.push(next);
                }
            }
        }

        delete temp;
    }
}

PS。由于我不再使用地图(切换到阵列)用于访问状态,我的DFS解决方案从123秒提高到54秒,但BFS仍然崩溃。

1 个答案:

答案 0 :(得分:6)

首先,您可能已经认识到,在 Lights Out 中,您不必多次翻转同一个开关,并且按翻转开关的顺序并不重要。因此,您可以通过两种不同的方式描述当前状态:根据哪些灯打开,或者根据哪些开关被翻转。后者与灯光的起始模式一起为您提供前者。

要使用图搜索算法来解决问题,您需要一个邻接概念。从第二个特征可以更容易地得出结论:如果只有一个开关,则两个状态相邻,它们不同。该特征还直接编码到每个节点的路径长度(=已翻转的交换机的数量),并且它减少了考虑的每个状态需要考虑的后续移动的数量,因为到每个节点的所有可能路径以开关模式编码。

您可以相对容易地在广度优先搜索中使用它(这可能是您实际上尝试过的)。在这种情况下,即使不使用显式优先级队列,BFS也相当于Dijkstra的算法,因为您将新节点排入队列以按优先级(路径长度)顺序进行探索。

您还可以通过添加合适的启发式将其转换为A *搜索。例如,由于每次移动最多关闭五个灯光,因此可以将启动后每次移动后仍然亮起的灯数除以5.虽然这有点粗糙,但我倾向于认为它会有所帮助。但是,您确实需要一个真正的优先级队列。

就实现而言,要认识到您既可以表示当前灯光的模式,也可以表示已按下位矢量的开关模式。每个模式都适合32位整数,访问状态列表需要2个 25 位,这完全在现代计算系统的容量范围内。即使您使用那么多字节,您也应该能够处理它。此外,您可以使用按位算术运算符执行所有需要的操作,尤其是XOR。因此,这个问题(在给定的大小)应该可以相对快速地计算出来。

<强>更新

正如我在评论中提到的,我决定为自己解决问题,在我看来 - 非常成功。我使用各种技术来实现良好的性能并最​​大限度地减少内存使用,在这种情况下,这些技术大多是互补的。以下是我的一些技巧:

  • 我用一个uint64_t表示每个整个系统状态。前32位包含一个位掩码,其中的开关已被翻转,而底部32包含一个位于其中的灯亮的位掩码。我将它们包含在struct中,并附带一个指针,将它们作为队列的元素链接在一起。可以将给定状态作为具有一个按位运算和一个整数比较的解决方案进行测试。

  • 我创建了一个预先初始化的25个uint64_t位掩码数组,表示每次移动的效果。在每个顶部32中的一个位设置表示被翻转的开关,并且在底部32中设置的3到5位之间表示作为结果切换的灯。然后,翻转一个开关的效果可以简单地计算为new_state = old_state ^ move[i]

  • 我实现了 plain 广度优先搜索而不是A *,部分原因是因为我试图快速将某些内容放在一起,特别是因为这样我可以使用常规队列代替优先队列。

  • 我以一种自然避免两次访问同一状态的方式构建了我的BFS,而不必实际跟踪哪些状态曾被排队。这是基于对如何有效地生成不同的位模式而不重复的一些见解,其中那些在具有更多位设置之前生成的比特集更少。无论如何,对于BFS,基于队列的方法很自然地满足了后一个标准。

  • 我使用第二个(普通)队列来回收从主队列中删除动态分配的队列节点,以最大限度地减少对malloc()的号码调用。

整体代码少于200行,包括空行和注释行,数据类型声明,I / O,队列实现(普通C,无STL) - 一切。

顺便说一句,请注意,标准Dijkstra和A *中使用的优先级队列主要是关于找到正确的答案(最短路径),而其次只是有效地这样做。从标准队列入队和出队都可以是O(1),而优先级队列上的那些操作在队列中的元素数量中是o(log m)。 A *和BFS在状态总数中都具有最差情况下的队列大小上限O(n)。因此,BFS在问题规模上将比A *更好地扩展;唯一的问题是前者是否可靠地给你正确的答案,在这种情况下,它确实如此。