一个概率(指数?)推理公式,我不明白如何实现

时间:2016-08-25 15:11:41

标签: algorithm formula exponential probability-theory

我试图从学术论文中实现真相发现算法。它是一种流式算法,可实时推断真实性和源质量。如果有人有兴趣阅读论文,请在此处提供更多详细信息:http://dl.acm.org/citation.cfm?id=2661892

我的问题是我不理解算法中的公式,或者是其中一个公式的精确符号,而且我在R或Python中实现它时遇到了困难。它似乎是某种指数式的公式,但我在数学书籍中找不到任何关于它的东西。也不确定半无穷大的标志。我认为它意味着成比例,但这是否意味着价值分配,或者什么?任何指针都将非常感激。

enter image description here

1 个答案:

答案 0 :(得分:0)

(你真的应该发表在数学或计算机科学上;你试图理解算法本身,而不是算法的实现。一个很大的缺点是Stack Overflow不允许LaTeX,所以请原谅阅读下面的内容。)

能够使用与#34;成比例的" symbol \ propto,你需要考虑表达式的左边是概率。

您可以使用以下作为"定义" \ propto:

P(X = x)\ propto f(x)< => P(X = x)= f(x)/(\ sum_ {x'} f(x'))

也就是说,P(X = x)与f(x)成比例,当用f(x')之和归一化时,所有值x'随机变量X。

例如,如果一个骨灰盒包含10个蓝色球和20个红色球,则绘制给定颜色的球的概率与该颜色的球的数量成比例。由于概率之和需要为1,这意味着按以下方式对它们进行标准化:

P(颜色=蓝色)\ propto 10

P(颜色=红色)\ propto 20

P(颜色=蓝色)= 10 /(10 + 20)= 1/3

P(颜色=红色)= 20 /(10 + 20)= 2/3。

现在,在您正在使用的论文中,他们使用非常紧凑的符号\ nu ^ t_ {i,v,j}作为随机变量及其值。在不知道论文的其余部分的情况下,我猜测\ nu ^ t_ {i,v,j}代表P(R ^ t_ {i,j} = v),即索引t,i和j表示正在谈论哪个随机变量R ^ t_ {i,j}(他们没有明确地在那里命名随机变量,所以为了清楚起见我只是在这里使用名称R),而索引v代表该随机变量的。但是,在假设索引v代表值的情况下,检查我是否正确会更好。

如果这个假设是正确的,那么这个表达意味着

\ nu ^ t_ {i,v,j} = f(v)/ sum_v' F(V&#39)

其中f代表表达式的右侧。

自然地,对于每个t,i,j,更有效的计算方法是为每个值v计算f(v)并将其存储在以v为索引的数组中,随时累积它们的总和,并且然后简单地将数组中的每个值除以最终总和。