加权游戏结果的公式/算法

时间:2010-10-07 08:33:08

标签: algorithm statistics formula probability game-theory

我有一个有趣的概念问题,我想知道是否有人可以帮我量化它。基本上,我正在玩一套游戏...而且对于每个游戏,我都知道我将获胜的可能性,我将获胜的概率,以及我将失去的概率(每场比赛将有不同的概率)。 / p>

在高层次上,我想知道的是:我应该关注哪些游戏?例如,我不打算投入任何我有0%获胜机会的游戏(或者我有100%获胜机会的游戏)。但是对于50/50的比赛,我会非常关心并且想要投入最多的努力。如果不涉及关系,那就简单了:“关怀能力”=我赢得50%的机会有多接近?但是通过关系,它会让事情复杂化。

我不确定这是非常必要的,但如果你需要,你可以假设一场胜利是0分,平局会给你1分,一场胜利会给你2分。换句话说,从失败到平局同样有价值,就像从领带到胜利一样。

您还可以假设所有游戏都是独立的。基本上,我只是在寻找“护理能力”的量化指标(例如0到1之间的值)。

有人对如何处理这样的事情有任何想法吗?如果你是一个经济学家,你可以想象我可以花费有限的资金来提高我赢得比赛的机会。你如何在游戏中分配这些美元以最大化你的预期结果?

提前致谢!

编辑:对不起,我已经意识到这是一个相当糟糕的措辞问题。我没有说明额外投资与产生的结果之间的关系。我想假设它是一种线性关系,但在这种情况下,你投资哪个游戏并不重要,因为它总会以同样的方式增加你的期望值。我的实际问题有点复杂,我需要重新考虑一下。感谢所有帮助过并提出好主意的人!

3 个答案:

答案 0 :(得分:1)

您可以将此表示为约束优化问题。

我现在要忽略抽奖......

所以你需要做的是首先让a_i成为你在游戏i上花费的金额。

赢得比赛i的机会大概是a_i的函数..称之为p_i(a_i)

您对游戏i的预期付款为2 * p_i(a_i)

所以你的总预期支出是P = 2 *总和(p_i(a_i))

你对花费的金额有一些约束... sum(a_i)= A

你的目标是根据约束最大化P。

使用拉格朗日方法,这为你提供了N + 1个方程式,可以同时求解未知数a_i和lambda。

这样的N个方程:

 2 p_i'(a_i) = lambda  

一个约束方程

 sum(a_i) = total

如何解决这些问题取决于p_i函数的结构。根据您的结构或p_i函数,您可能需要引入每个a_i>的附加约束。 0.我试着构建我的p_i来避免这种情况,因为它使得求解方程更加困难。

如果您想介绍抽签的机会,您可以将p_i(a_i)分成w_i(a_i)和d_i(a_i),并将每场比赛的奖金更改为2 * w_i(a_i)+ 1 * d_i( a_i)..虽然这不会改变任何核心数学。

答案 1 :(得分:0)

  

但是对于50/50的比赛,我会关心的   很多,想要投入最多   努力。如果不涉及关系,那就是   就像这样简单:“护理能力”   =我赢得50%的机会有多接近?但是有了关系,它会变得复杂   的东西。

我不这么认为。如果你正在寻找一个50/50获胜机会的游戏,那么它不仅仅是计算“我赢得的机会有多接近再加上一半的机会达到50%” - 或者我误解了你的问题吗?

修改

公式如下:

x = 1 - abs(0.5-abs(win% + tie%/2));
                 ^ the inner 'abs' here may be useless, but i'm not sure ;)

答案 2 :(得分:0)

我认为你需要考虑的最明显的事情是需要多少资源(努力,美元,等等)才能改变概率?

使用美元作为一个简单的例子,如果你有一个游戏,你目前有0%的机会赢,但1美元会给你50%的机会赢,那么这是一个更好的选择,而不是1美元将有50%的机会赢得99%的机会。

从广义上讲,我认为你需要为每场比赛的胜利/平局/失利应用一个值(正如你已经提到的那样)。然后你可以计算出你当前的预期总价值(例如50%胜利,25%平局和25%损失将给出0.5 * 2 + 0.25 * 1 + 0.25 * 0 = 1.25预期点数)。目标是尽可能使用所有资源来尽可能地提高总预期值。

最后一步完全取决于您的资源到成功功能。对此功能的分析可能使其成为一种简单的解决方案。

一些示例工作公式:

1)线性 - 一个单位的资源将增加你赢得和抽出X的概率。

这意味着只要你还没有消除失败的机会,你付出的努力并不重要。把精力投入到你可能失去的任何游戏中。

2)反向 - 获胜/获得更高利益的机会越低

如果一个单位的努力产生“X /赢机会”增加以赢得机会,那么你显然将从提升你最糟糕的游戏中获得最大的收益。

3)中点倾向 - 你越接近平等的胜利/失败,你就越有利于

这模拟了这样一个事实,即你很可能赢得比赛或者很可能输掉的比赛最不可能改进(如果某人比你好得多,那么这项努力可能并不重要)。在这种情况下,你可能希望专注于那些几乎赢得/失去机会的人,试图获得最大的增长。

我希望这是有道理的。 :)