换位表导致国际象棋引擎丢失

时间:2015-12-10 03:40:38

标签: c++ chess

前奏:我理解这个问题可能对于Stack Overflow这样的问题有点过于宽泛。虽然,我试图添加尽可能多的信息。

我正在从头开始用C ++编写国际象棋引擎,并且它主要完成(除了它具有弱评估函数)。但奇怪的是,每次启用转置表时引擎都会丢失一个非常明显的错误(放弃一个女王,或者有时一个女王和另一个)。当转置表探测被禁用时,引擎很容易胜过Nero和TSCP。

我使用一个非常简单的转置表实现和一个always-replace方案,取自Bruce Morland的网站here

这是探针实现:

bool probe_table(TranspositionTable& t_table, unsigned int ply,
uint64 hash_key, unsigned int depth, unsigned int& pv_move, int& score,
int alpha, int beta)
{
    unsigned int index = hash_key % t_table.num_entries;

    assert(index < t_table.num_entries);

    if(t_table.t_entry[index].hash_key == hash_key)
    {
        pv_move = t_table.t_entry[index].move;

        if(t_table.t_entry[index].depth >= depth)
        {
            score = t_table.t_entry[index].score;

            if(score > IS_MATE) score -= ply;
            else if(score < -IS_MATE) score += ply;

            switch(t_table.t_entry[index].flag)
            {
                case TFALPHA:
                {
                    if(score <= alpha)
                    {
                        score = alpha;
                        return 1;
                    }
                }
                case TFBETA:
                {
                    if(score >= beta)
                    {
                        score = beta;
                        return 1;
                    }
                }
                case TFEXACT:
                {
                    return 1;
                }
                default: assert(false); // At least one flag must be set.
            }
        }
    }

    return 0;
}

在alpha-beta搜索期间,探测表格(条目也正确存储,具体取决于截止值等):

if(probe_table(board.t_table, board.ply, board.hash_key, depth, pv_move,
    score, alpha, beta))
{
    return score;
}

编辑:为了完整起见,以下是搜索中存储代码的重要部分:

if(score > alpha) // Alpha cutoff.
{
    if(score >= beta) // Beta cutoff.
    {
        ...

        store_entry(board.t_table, board.ply, board.hash_key, best_move,
                    beta, depth, TFBETA);

        return beta;
    }

    alpha = score;

    ...
    }
}

...

assert(alpha >= old_alpha);

if(alpha != old_alpha)
{
    store_entry(board.t_table, board.ply, board.hash_key, best_move,
        best_score, depth, TFEXACT);
}
else
{
    store_entry(board.t_table, board.ply, board.hash_key, best_move,
        alpha, depth, TFALPHA);
}

我已经考虑并探索了发动机其他部分的故障,但没有发生任何事情。完全禁用探测(但仍然使用表来存储PV线),效果很好。

我还考虑过我天真的思考实施是否影响了事情。要思考,只要有可能的思考,我就会将bestmove xxxx ponder xxxx打印到UCI。如果启用了思考,GUI会让引擎思考(这只是一个常规搜索,但稍后会通过转置表使用)。

为了测试,我完全禁用了思考,没有任何改进。在获得一段时间的获胜分数后,引擎只是放弃了它的女王。我相信这种情况要么是由于表中的一些错误输入,要么是其他一些我无法理解的不稳定因素。

这就是我需要一个遇到过这个问题的人,让我指出一个大方向。

编辑:正如grek40所问,这是一个刚刚发生的例子(引擎是白色,白色移动):

Position

引擎再一次,基于愚蠢的动作输掉了比赛。请注意,引擎到达了一个不好的位置,例如这个可能是因为换位表本身。

使用 分析此位置

在游戏中填充的换位表:

info score cp -425 depth 1 nodes 1 time 0 pv e1d1
info score cp -425 depth 2 nodes 2 time 0 pv e1d1
info score cp -425 depth 3 nodes 3 time 0 pv e1d1
info score cp -425 depth 4 nodes 4 time 0 pv e1d1
info score cp -425 depth 5 nodes 5 time 0 pv e1d1
info score cp -425 depth 6 nodes 6 time 0 pv e1d1
info score cp -425 depth 7 nodes 7 time 0 pv e1d1
info score cp -425 depth 8 nodes 8 time 0 pv e1d1
info score cp -425 depth 9 nodes 9 time 0 pv e1d1
info score cp -425 depth 10 nodes 10 time 0 pv e1d1
info score cp -440 depth 11 nodes 10285162 time 3673 pv f5f8 e7f8 b2b3 b7b5 e1c1 d6d5 a3a4
info score cp -440 depth 12 nodes 29407669 time 10845 pv f5f8 e7f8 e1f1 f8e7 f1f5 d6d5
bestmove f5f8 ponder e7f8

再次分析 没有 转置表(实际上,使用表格,但已清除):

info score cp -415 depth 1 nodes 82 time 0 pv f5f8
info score cp -415 depth 2 nodes 200 time 0 pv f5f8 e7f8
info score cp -405 depth 3 nodes 900 time 0 pv f5f8 e7f8 b2b3
info score cp -425 depth 4 nodes 2936 time 1 pv f5f8 e7f8 b2b3 f8e7
info score cp -415 depth 5 nodes 10988 time 4 pv f5f8 e7f8 b2b3 b7b5 e1d1
info score cp -425 depth 6 nodes 65686 time 25 pv f5f8 e7f8 e1f1 d7e7 f1d1 b7b5
info score cp -420 depth 7 nodes 194124 time 76 pv f5f8 e7f8 b2b3 b7b5 e1f1 f8e7 f1f7
info score cp -425 depth 8 nodes 357753 time 141 pv f5f8 e7f8 b2b3 b7b5 e1f1 f8e7 f1f5 d7c7
info score cp -425 depth 9 nodes 779686 time 292 pv f5f8 e7f8 e1f1 f8e7 f1f5 h4h8
info score cp -425 depth 10 nodes 1484178 time 560 pv f5f8 e7f8 e1f1 f8e7 f1f5 h4h8
info score cp -435 depth 11 nodes 29481132 time 11117 pv f5f8 d6d5 e1e5
info score cp -435 depth 12 nodes 106448053 time 41083 pv f5f8 e7f8
bestmove f5f8 ponder e7f8

值得注意的是,在深度10上,从换位表搜索中得分是准确的。

编辑:比赛结束后对此位置进行了分析。在游戏过程中,引擎没有足够的时间将搜索完成到更高的深度,导致它播放e1d1,这很荒谬。

为什么会发生这种情况?引擎从深度1开始发现更好的移动,但是从转置表中发现了不同的移动。我也想知道为什么转置表搜索中没有PV线。

我最好的猜测 将是来自Bruce Morland网站的搜索不稳定性引用:Zobrist密钥没有考虑到达节点的路径。不是每条路都一样。如果在树中的某个其他点遇到重复,则散列元素中的分数可能基于包含重复的路径。重复可能会导致平局得分,或者至少得分不同。

编辑:我尝试在没有TFEXACT值时禁用存储到表中。也就是说,我停止存储和检索TFALPHA / TFBETA值并且它工作得非常好。有人知道为什么吗?

1 个答案:

答案 0 :(得分:0)

我确实注意到您在检查是否符合您的深度标准之前设置您的(通过引用传递)pv_move 。这意味着probe_table可能正在更改pv_move并仍然返回0(没有匹配)(以及设置score)。那看起来很糟糕?