我正在探索如何在具有alpha-beta修剪的连接四游戏中使用Minimax算法。
所以我正在查看有关Connect4播放器策略的源代码,并找到了这个评估函数:
/**
* Get the score of a board
*/
public int score(){
int score = 0;
for (int r= 0; r < ROWS; r++) {
if (r <= ROWS-4) {
for (int c = 0; c < COLS; c++) {
score += score(r, c);
}
} else {
for (int c = 0; c <= COLS-4; c++) {
score += score(r, c);
}
}
}
return score;
}
/**
* Helper method to get the score of a board
*/
public int score(int row, int col){
int score = 0;
boolean unblocked = true;
int tally = 0;
//int r, c;
if (row < ROWS-3) {
//check up
unblocked = true;
tally = 0;
for (int r=row; r<row+4; r++) {
if (board[r][col] == CHECKERS[1-playerToMoveNum]) {
unblocked = false;
}
if (board[r][col] == CHECKERS[playerToMoveNum]) {
tally ++;
}
}
if (unblocked == true) {
score = score + (tally*tally*tally*tally);
}
if (col < COLS-3) {
//check up and to the right
unblocked = true;
tally = 0;
for (int r=row, c=col; r<row+4; r++, c++) {
if (board[r][c] == CHECKERS[1-playerToMoveNum]) {
unblocked = false;
}
if (board[r][c] == CHECKERS[playerToMoveNum]) {
tally ++;
}
}
if (unblocked == true) {
score = score + (tally*tally*tally*tally);
}
}
}
if (col < COLS-3) {
//check right
unblocked = true;
tally = 0;
for (int c=col; c<col+4; c++) {
if (board[row][c] == CHECKERS[1-playerToMoveNum]) {
unblocked = false;
}
if (board[row][c] == CHECKERS[playerToMoveNum]) {
tally ++;
}
}
if (unblocked == true) {
score = score + (tally*tally*tally*tally);
}
if (row > 2) {
//check down and to the right
unblocked = true;
tally = 0;
for (int r=row, c=col; c<col+4; r--, c++) {
if (board[r][c] == CHECKERS[1-playerToMoveNum]) {
unblocked = false;
}
if (board[r][c] == CHECKERS[playerToMoveNum]) {
tally ++;
}
}
if (unblocked == true) {
score = score + (tally*tally*tally*tally);
}
}
}
return score;
}
我在此PDF中找到了所有这些代码:http://ryanmaguiremusic.com/media_files/pdf/ConnectFourSource.pdf
我只是想了解这个评估功能如何运作并决定最佳举措...... 谁能给我一些帮助?非常感谢。
答案 0 :(得分:2)
以下是一般答案:
评估应该为更好的职位提供更好的价值。在游戏中,通常通过以下方式计算得分来评估位置:增加期望配置/事件的得分并且针对不期望的配置/事件减少得分。确定评估特征应该改变多少值(=平衡权重)可能非常困难。
如果我们将此应用于连接四个,那么一个功能可能就是有效威胁的数量。但是对于一个非常好的算法(它解决了7x6),你必须看看获胜的动作是在奇数线还是偶数线上。然后有一些规则,如“如果第二个玩家有两个甚至威胁他赢得了比赛”(这一切都归结为填补董事会和移动被迫,给出的规则有点简化:第二个玩家将如果第一个玩家在那里有一个奇怪的威胁,如果他不能填补其他列,则必须杀死一个甚至威胁。)
给出规则的简单示例(O =第一个玩家,X =第二个玩家),X获胜:
* X X X *
O O X O O
1 2 3 4 5 6 7
曾经有一篇非常详细的科学论文。我目前最接近的是:http://web.mit.edu/sp.268/www/2010/connectFourSlides.pdf 应该给你一些想法。
顺便说一下。打开书籍(通常是任何形式的预定义智慧,例如joseki,fuseki)和特殊的最终游戏评估员都可以大大提高极小极大的性能。