国际象棋的统计方法?

时间:2010-04-26 22:50:52

标签: algorithm statistics machine-learning chess

阅读Google solves the translation problem如何让我æ€è€ƒã€‚是å¦æœ‰å¯èƒ½é€šè¿‡åˆ†æžæ•°ç™¾ä¸‡ä¸ªæ¸¸æˆå¹¶ç¡®å®šåŸºäºŽï¼ˆå®Œå…¨ï¼Ÿï¼‰ç»Ÿè®¡æ•°æ®çš„最佳å¯èƒ½ç§»åŠ¨æ¥æž„建强大的国际象棋引擎?有几个这样的国际象棋数æ®åº“(this是一个拥有450万个游æˆçš„国际象棋数æ®åº“),并且有一个å¯èƒ½ä½¿ç”¨è¯¸å¦‚所涉åŠçš„çƒå‘˜çš„评级,年龄等因素对相åŒï¼ˆæˆ–é•œåƒæˆ–å射)ä½ç½®çš„移动进行加æƒã€‚游æˆæ˜¯ï¼ˆè€ƒè™‘到国际象棋ç†è®ºçš„改进)等。ä¸èƒ½æž„建国际象棋引擎的å¯è¡Œæ–¹æ³•çš„任何ç†ç”±ï¼Ÿ

11 个答案:

答案 0 :(得分:21)

这样的事情已ç»å®Œæˆï¼šå®ƒæ˜¯opening books的基本概念。

由于游æˆçš„性质,计算机AI在一开始就是出了å的糟糕,当有很多å¯èƒ½æ€§æ—¶ï¼Œæœ€ç»ˆç›®æ ‡ä»ç„¶é¥é¥é¢†å…ˆã€‚当战术å¯èƒ½æ€§å¼€å§‹å½¢æˆæ—¶ï¼Œå®ƒå¼€å§‹å‘中间å‘展,并且在最终游æˆä¸­å¯ä»¥å®Œç¾Žåœ°å‘挥,远远超过大多数人的能力。

为了帮助AI在开始时åšå‡ºå¥½çš„动作,许多引擎ä¾èµ–于打开书ç±ï¼šåŸºæœ¬ä¸Šæ˜¯ç»Ÿè®¡æŽ¨å¯¼å‡ºçš„动作æµç¨‹å›¾ã€‚高评级玩家之间的许多游æˆéƒ½è¿›è¡Œäº†åˆ†æžï¼Œå»ºè®®è¢«ç¡¬ç¼–ç æˆâ€œä¹¦â€ï¼Œè™½ç„¶ä½ç½®ä»åœ¨â€œä¹¦ä¸­â€ï¼Œä½†AI甚至没有“æ€è€ƒâ€ï¼Œåªæ˜¯æŒ‰ç…§â€œä¹¦â€ “说。

有些人也å¯ä»¥è®°ä½å¼€å·ä¹¦ï¼ˆè¿™ä¸»è¦æ˜¯ä¸ºä»€ä¹ˆFischerå‘明了他的random chesså˜ä½“,因此记忆开头å˜å¾—ä¸é‚£ä¹ˆæœ‰æ•ˆäº†ã€‚部分由于这个原因,有时在一开始就采å–éžä¼ ç»Ÿçš„举动,而ä¸æ˜¯å› ä¸ºå®ƒåœ¨ç»Ÿè®¡ä¸Šæ˜¯åŽ†å²ä¸Šæœ€å¥½çš„举动,而æ°æ°ç›¸å:它ä¸æ˜¯ä¸€ä¸ªâ€œå·²çŸ¥â€çš„ä½ç½®ï¼Œå¯ä»¥å¸¦èµ°ä½ çš„对手(人或计算机)出书“。

在频谱的å¦ä¸€ç«¯ï¼Œæœ‰ä¸€ä¸ªå为endgame tablebase的东西,它基本上是先å‰åˆ†æžçš„残局ä½ç½®çš„æ•°æ®åº“。由于这些èŒä½ä»¥å‰æ˜¯å½»åº•æœç´¢è¿‡çš„,所以å¯ä»¥ä½¿ç”¨å®ƒæ¥å®žçŽ°å®Œç¾Žçš„游æˆï¼šç»™å®šä»»ä½•ä½ç½®ï¼Œå¯ä»¥ç«‹å³å†³å®šå®ƒæ˜¯èµ¢ï¼Œè¾“或抽,以åŠå®žçŽ°/é¿å…结果的最佳方å¼æ˜¯ä»€ä¹ˆã€‚

在国际象棋中,这样的事情åªé€‚用于开场和比赛结æŸã€‚中间游æˆçš„å¤æ‚性使游æˆå˜å¾—有趣。如果åªæ˜¯é€šè¿‡æŸ¥çœ‹æ¡Œå­å°±å¯ä»¥ä¸‹æ£‹ï¼Œé‚£ä¹ˆæ¸¸æˆå°†ä¸ä¼šåƒå®ƒé‚£æ ·ä»¤äººå…´å¥‹ï¼Œæœ‰è¶£å’Œæ·±åˆ»ã€‚

答案 1 :(得分:6)

嗯,450万场比赛ä»ç„¶åªæ¶µç›–了所有å¯èƒ½æ¸¸æˆçš„一å°éƒ¨åˆ†ï¼ˆæžå°ï¼‰ã€‚

虽然你会有大é‡çš„胜利和失败的ä½ç½®ï¼Œä½†è¿™ä¼šç•™ä¸‹å°†å…¶å‡å°‘为一组å¯ç”¨å‚数的问题。一个éžå¸¸å¤è€çš„问题,神ç»ç½‘络作为标准方法。但神ç»ç½‘络并没有赢得国际象棋锦标赛。

答案 2 :(得分:3)

è¿™ç§ä¸€èˆ¬ç­–略已ç»å°è¯•è¿‡å„ç§æ¸¸æˆã€‚通常,人们通过让计算机自己玩游æˆæ¥ç”Ÿæˆé€‚当大的游æˆæ•°æ®åº“。一个快速的互è”网æœç´¢å‡ºçŽ°http://www.cs.princeton.edu/courses/archive/fall06/cos402/papers/chess-RL.pdf - 它建立在步步高之å‰çš„工作基础之上。在国际象棋中,蛮力å‰çž»å¯¹è®¡ç®—机æ¥è¯´éžå¸¸æœ‰æ•ˆ - 而且一般æ¥è¯´ï¼Œå½“ä½ å¯ä»¥æ··åˆæ‰€æœ‰ä»¥å‰å·²çŸ¥çš„有关问题的信æ¯æ—¶ï¼Œç»Ÿè®¡æ•°æ®ä¼šæ›´æœ‰æ•ˆï¼Œè€Œä¸æ˜¯è¯•å›¾ä»Žæ•°æ®ä¸­é‡æ–°å­¦ä¹ å®ƒã€‚ 。我注æ„到,在这个链接中,计算机在预测的底部而ä¸æ˜¯æ•´ä¸ªè¿‡ç¨‹ä¸­äº†è§£äº†è¯„估函数的å«é‡ã€‚

答案 3 :(得分:2)

在计算机Go中有类似的东西å¯ä»¥å¾ˆå¥½åœ°è¿ä½œ - UCT method。它ä¸ä½¿ç”¨å·²çŸ¥çš„一组游æˆï¼Œè€Œæ˜¯æ’­æ”¾å¤§é‡çš„éšæœºæ¸¸æˆï¼ŒåŒæ—¶ä¿æŒç»Ÿè®¡æ•°æ®ç§»åŠ¨å¯¼è‡´æ›´é«˜çš„胜率。它是从当å‰ä½ç½®å¼€å§‹çš„。

统计数æ®ä¿å­˜åœ¨ä¸€ä¸ªç§»åŠ¨æ ‘中(类似于minimax中使用的一个)并影å“下一个éšæœºæ¸¸æˆçš„选择 - 更频ç¹åœ°é€‰æ‹©å…·æœ‰æ›´é«˜èƒœçŽ‡çš„移动。树的增长也å—到游æˆçš„引导 - 通常æ¯ä¸ªæ¸¸æˆéƒ½ä¼šåœ¨æ ‘上添加一片å¶å­ã€‚这导致了更有å‰é€”的路径被探索。

答案 4 :(得分:1)

我喜欢这个想法,但是当考虑到自然语言中å¥å­çš„上下文所需è¦çš„元素比棋盘ä½ç½®çš„上下文è¦å°‘得多时,类比[带文本翻译]似乎ä¸è¶³ä¹‹å¤„ (å³ä½¿è¿™äº›å¥å­çš„元素,å³å•è¯ï¼Œå¯èƒ½æ¥è‡ªæ¯”国际象棋游æˆå…ƒç´ æ›´å¤§çš„集åˆï¼Œå³æ¸¸æˆæ£‹å­ï¼Œéª‘士,典当等)。 此外,多语ç§è¯­æ–™åº“çš„å¯ç”¨æ€§ï¼ˆå„ç§è¯­è¨€çš„文档,å„ç§è¯­è¨€ï¼‰è¿œè¿œè¶…过人们å¯ä»¥åœ¨æ•°å­—å½¢å¼ä¸­æ‰¾åˆ°çš„国际象棋游æˆæ•°é‡ï¼Œç‰¹åˆ«æ˜¯å½“考虑到国际象棋分æžæ—¶ï¼Œäººä»¬éœ€è¦æ•´ä¸ªæ¸¸æˆï¼Œä¸ºäº†ç¿»è¯‘目的,人们å¯ä»¥ç‹¬ç«‹äºŽæ–‡æœ¬çš„其余部分使用æ¯ä¸ªå¥å­ã€‚

结果,除了游æˆçš„开放部分(当董事会èŒä½æ²¡æœ‰å¤ªå¤šæœºä¼šç›¸å¯¹äºŽå…¶ä»–游æˆå‘散)时,国际象棋游æˆçš„æ•°é‡è¦æ±‚引入一些统计æ„义必须是天文数字......

è¦è·‘步,但我会回过头æ¥å¯¹å¯èƒ½çš„国际象棋比赛数é‡è¿›è¡Œå…·ä½“估计(ç»å¯¹æ•°æ®å’Œåˆç†æ¸¸æˆçš„å­é›†ï¼‰ï¼Œå¹¶ä¸”应该有效地è¯æ˜Žè¿™ä¸€æ•°å­—是450万游æˆæ˜¯ä¸€ä¸ªç›¸å¯¹è¾ƒå°çš„样本。

答案 5 :(得分:1)

在国际象棋中大约有10个 123 游æˆæ ‘,其中你在该数æ®åº“中有大约4.5×10 6 。我们å¯ä»¥å¿½ç•¥æ¸¸æˆæ ‘,并且åªè€ƒè™‘状æ€ç©ºé—´å¤æ‚性,其中有10个 43 å’Œ10个 50 åˆæ³•çŠ¶æ€ä¹‹é—´çš„任何地方。让我们å‡è®¾è¯¥æ•°æ®åº“中的所有游æˆéƒ½æœ‰ç‹¬ç‰¹çš„移动,并且æ¯åœºæ¯”赛平å‡æœ‰1000次移动,这给我们4.5×10 9 状æ€ã€‚å–å¯èƒ½çŠ¶æ€çš„估计下界10 43 ,仅涵盖所有州的4.5×10 -34 。我ä¸çŸ¥é“排除旋转或å射的独特电路æ¿ä½ç½®çš„总数是多少,但它åªä¼šå‡å°‘两å€å·¦å³ï¼Œè¿™ä¸æ˜¯å¾ˆæœ‰å¸®åŠ©ã€‚

您需è¦åœ¨ç»Ÿè®¡å¼•æ“Žä¸­æ·»åŠ æ›´å¤šé¢†åŸŸçŸ¥è¯†ï¼Œå¹¶æ‰¾å‡ºä¸¤ä¸ªç»™å®šè‘£äº‹ä¼šèŒä½ä¹‹é—´çš„相似程度,因为有10分之1 35 的机会,您将找ä¸åˆ°åŒ¹é…电路æ¿ä½ç½®ï¼ˆåŒ…括å射和旋转)。我认为这里最大的关键是找到两个给定的董事会èŒä½å¦‚何相似。这将包å«æ›´å¤šçš„领域知识,而ä¸ä»…仅是简å•çš„转æ¢ã€‚

尽管如此,这是一个很好的想法,值得进一步探索,尽管我怀疑它是在国际象棋的å¤æ‚性åŠå…¶å‘¨å›´çš„兴趣之å‰å°è¯•è¿‡çš„。

答案 6 :(得分:1)

我会说是的,它å¯ä»¥å¥æ•ˆã€‚没有人真的å°è¯•è¿‡å®ƒï¼Œä½†ä¸ºä»€ä¹ˆä¸ç”¨ç»Ÿè®¡æ–¹æ³•å¯»æ‰¾â€œæ¨¡å¼â€ã€‚我ä¸è€ƒè™‘存储整个电路æ¿ï¼Œå› ä¸ºå­˜å‚¨å¤©æ–‡æ•°å­—的电路æ¿ä½ç½®å¾ˆå¤šï¼Œä½†åªæ˜¯å¯»æ‰¾ç‰¹å®šçš„模å¼ã€‚

寻找模å¼

一个典型的国际象棋程åºä¼šå¯¹å…¬è®¤çš„模å¼è¿›è¡Œè¯„估并给予奖励,例如良好的防å«æ£‹å­æˆ–开放的车队线,å¦ä¸€æ–¹é¢æƒ©ç½šåŒå€çš„棋å­ç­‰ã€‚

这些模å¼å¯ä»¥åœ¨64ä½æŽ©ç ä¸­æœ‰æ•ˆç¼–程。对于那些é‡è¦çš„ä½ç½®ï¼Œæ‚¨å°†ä½¿ç”¨ä½æŽ©ç ï¼Œå¹¶ä¸ºè¿™äº›ä½ç½®ä¸­çš„预期碎片进行ä½æŽ©ç ã€‚æ¯ä¸ªæ¨¡å¼éƒ½éœ€è¦æ—¶é—´æ¥åŒ¹é…,因此找到有所作为的模å¼éžå¸¸é‡è¦ã€‚这就是谷歌使用统计方法的地方。它å¯ä»¥è´¯ç©¿â€œåŽ†å²æ€§â€æ¸¸æˆå¹¶å¯»æ‰¾æ¨¡å¼ã€‚找到模å¼åŽï¼Œå¿…须计算模å¼çš„æƒé‡ï¼Œçœ‹çœ‹æ”¹è¿›çš„评估是å¦è¶…过了开销。

我认为这对于PHD论文æ¥è¯´æ˜¯ä¸€ä¸ªç›¸å½“庞大的å°è¯•é¡¹ç›®ï¼Œç”šè‡³è¿‡å¤šã€‚

答案 7 :(得分:0)

机器学习最近å–得了很大的进步,尤其是在谷歌队使用ML击败GO冠军之åŽã€‚它现在也用国际象棋è¯æ˜Žäº†ã€‚看看麻çœç†å·¥å­¦é™¢æŠ€æœ¯è¯„论中的文章https://www.technologyreview.com/s/541276/deep-learning-machine-teaches-itself-chess-in-72-hours-plays-at-international-master/

ML的深度学习是对旧的神ç»ç½‘络自我调整AI算法的增强。 Lai的演示并没有教给机器国际象棋的基本规则或关心比赛的结果。他åªæ˜¯ç»™æœºå™¨å–‚了一个庞大的游æˆæ•°æ®åº“,然åŽæœºå™¨æ‰¾åˆ°äº†å…¶ä½™çš„东西,然åŽçŽ©äº†ä¸€ä¸ªåˆç†çš„人类游æˆã€‚水平。

我å‡è®¾ä¸¤ä¸ªé‡è¦çš„增强功能是通过教授规则使其更有效率,然åŽé€šè¿‡æ供游æˆçš„实际结果æ¥å¼•å¯¼å®ƒã€‚ 然åŽåœ¨é‚£ä¹‹åŽæ­ä¹˜çŽ°æœ‰çš„国际象棋冠军,åƒé³•é±¼è¿™æ ·çš„å¼•æ“Žï¼ ï¼š - )

答案 8 :(得分:0)

类似于击败Master Human玩家的GO程åºçš„深度学习算法å¯èƒ½æ˜¯æ€æ‰‹é”。但这需è¦å¾ˆé«˜çš„æˆæœ¬ã€‚但是,å¯ä»¥ä½¿ç”¨GO中学到的深度学习模å¼å¹¶åº”用  国际象棋。

答案 9 :(得分:0)

我没有æ到的一件事是考虑数æ®åº“中游æˆä¸­çŽ©å®¶çš„等级。一些具有较高分è´ç™¾åˆ†æ¯”的空缺是由于更好的玩家倾å‘于获胜而对空缺的价值åªå­—ä¸æ。

事实上,我认为数æ®åº“仅对一件事有用,这表明æµè¡Œçš„是什么方法。ä¸ä»…如此,您实际上还扩展了对数æ®çš„ç†è§£ï¼Œè¶…越了它的优点。

类似地,计算机分æžä»…显示了计算机与计算机游æˆçš„最佳结果。人与人之间的游æˆæœ‰æ‰€ä¸åŒï¼Œæ‚¨ä¸åº”过于ä¾èµ–计算机分æžã€‚

æ•°æ®åº“和计算机分æžéƒ½å¾ˆæœ‰è¶£ï¼Œä½†æ˜¯å¾ˆå®¹æ˜“被误解。æ防。

答案 10 :(得分:-1)

Chinmay,

我知é“这是一个è€çº¿ç¨‹ï¼Œä½†è¿™æ˜¯æˆ‘最近一直在探索的è¯é¢˜ã€‚上é¢å›žç­”的大多数人并没有真正得到你的问题。我认为,是的,值得分æžè¿‡åŽ»çš„许多游æˆæ¥åˆ¶å®šå»ºè®®çš„举措。它会涵盖所有å¯èƒ½çš„动作å—?ä¸ï¼Œæ˜¾ç„¶ä¸æ˜¯ã€‚但它涵盖了真实游æˆçš„所有真实动作。一个人(或å¦ä¸€ä¸ªè®¡ç®—机算法)必须开始播放éžå¸¸å¥‡æ€ªçš„动作æ¥æŠ›å¼ƒå®ƒã€‚所以,你ä¸èƒ½å»ºç«‹ä¸€ä¸ªä¸€ç›´èµ¢çš„“完美â€ç®—法,但如果它赢了很多,比如说> 2200 FIDE等级,它还ä¸é”™å—?如果你åˆå¹¶äº†Openingså’ŒEndgames,ä¸ä»…ä»…ä¾é è¿‡åŽ»çš„移动分æžï¼Œå®ƒè¿˜èƒ½è®©å®ƒæˆä¸ºæ›´å¥½çš„引擎。

有一个天文数字å¯èƒ½çš„董事会èŒä½ï¼Œä½†å®ƒæ˜¯æœ‰é™çš„,如果你删除愚蠢的ä½ç½®ï¼Œå®ƒä¼šå‡å°‘相当多的数字。是å¦å¯ä»¥å°†4,5或6个玩家的棋å­æŽ’在åŒä¸€ä¸ªæ–‡ä»¶ä¸­ï¼Ÿæ˜¯çš„,它会在真实游æˆä¸­å‘生å—?怀疑。在对手“退出书本â€çš„情况下,将基本的国际象棋大脑纳入你的逻辑。例如,Micro Maxåªæœ‰å‡ ç™¾è¡Œä»£ç ã€‚如果对手玩愚蠢以阻止你的动作,他们å¯èƒ½ä¼šè¢«ä¸€ä¸ªç®€å•çš„引擎击败。