此评估功能如何在Connect 4游戏中运行? (JAVA)

时间:2015-06-19 23:57:41

标签: java minimax alpha-beta-pruning evaluation-function

我正在探索如何在具有alpha-beta修剪的连接四游戏中使用Minimax算法。

所以我正在查看有关Connect4播放器策略的源代码,并找到了这个评估函数:

/**
* Get the score of a board
*/
public int score(){
    int score = 0;
    for (int r= 0; r < ROWS; r++) {
        if (r <= ROWS-4) {
            for (int c = 0; c < COLS; c++) {
                score += score(r, c);
            }
        } else {
            for (int c = 0; c <= COLS-4; c++) {
                score += score(r, c);
            }
        }
    }
    return score;
}


/**
* Helper method to get the score of a board
*/
public int score(int row, int col){
    int score = 0;
    boolean unblocked = true;
    int tally = 0;
    //int r, c;
    if (row < ROWS-3) {
        //check up
        unblocked = true;
        tally = 0;

        for (int r=row; r<row+4; r++) {
            if (board[r][col] == CHECKERS[1-playerToMoveNum]) {
                unblocked = false;
            }
            if (board[r][col] == CHECKERS[playerToMoveNum]) {
                tally ++;
            }
        }
        if (unblocked == true) {
            score = score + (tally*tally*tally*tally);
        }
        if (col < COLS-3) {
            //check up and to the right
            unblocked = true;
            tally = 0;
            for (int r=row, c=col; r<row+4; r++, c++) {
                if (board[r][c] == CHECKERS[1-playerToMoveNum]) {
                    unblocked = false;
                }
                if (board[r][c] == CHECKERS[playerToMoveNum]) {
                    tally ++;
                }
            }
            if (unblocked == true) {
                score = score + (tally*tally*tally*tally);
            }
        }
    }
    if (col < COLS-3) {
        //check right
        unblocked = true;
        tally = 0;
        for (int c=col; c<col+4; c++) {
            if (board[row][c] == CHECKERS[1-playerToMoveNum]) {
                unblocked = false;
            }
            if (board[row][c] == CHECKERS[playerToMoveNum]) {
                tally ++;
            }
        }
        if (unblocked == true) {
            score = score + (tally*tally*tally*tally);
        }
        if (row > 2) {
            //check down and to the right
            unblocked = true;
            tally = 0;
            for (int r=row, c=col; c<col+4; r--, c++) {
                if (board[r][c] == CHECKERS[1-playerToMoveNum]) {
                    unblocked = false;
                }
                if (board[r][c] == CHECKERS[playerToMoveNum]) {
                    tally ++;
                }
            }
            if (unblocked == true) {
                score = score + (tally*tally*tally*tally);
            }
        }
    }
    return score;
}

我在此PDF中找到了所有这些代码:http://ryanmaguiremusic.com/media_files/pdf/ConnectFourSource.pdf

我只是想了解这个评估功能如何运作并决定最佳举措...... 谁能给我一些帮助?非常感谢。

1 个答案:

答案 0 :(得分:2)

以下是一般答案:

评估应该为更好的职位提供更好的价值。在游戏中,通常通过以下方式计算得分来评估位置:增加期望配置/事件的得分并且针对不期望的配置/事件减少得分。确定评估特征应该改变多少值(=平衡权重)可能非常困难。

如果我们将此应用于连接四个,那么一个功能可能就是有效威胁的数量。但是对于一个非常好的算法(它解决了7x6),你必须看看获胜的动作是在奇数线还是偶数线上。然后有一些规则,如“如果第二个玩家有两个甚至威胁他赢得了比赛”(这一切都归结为填补董事会和移动被迫,给出的规则有点简化:第二个玩家将如果第一个玩家在那里有一个奇怪的威胁,如果他不能填补其他列,则必须杀死一个甚至威胁。)

给出规则的简单示例(O =第一个玩家,X =第二个玩家),X获胜:

  * X X X *
O   O X O   O
1 2 3 4 5 6 7

曾经有一篇非常详细的科学论文。我目前最接近的是:http://web.mit.edu/sp.268/www/2010/connectFourSlides.pdf 应该给你一些想法。

顺便说一下。打开书籍(通常是任何形式的预定义智慧,例如joseki,fuseki)和特殊的最终游戏评估员都可以大大提高极小极大的性能。