我试图从学术论文中实现真相发现算法。它是一种流式算法,可实时推断真实性和源质量。如果有人有兴趣阅读论文,请在此处提供更多详细信息:http://dl.acm.org/citation.cfm?id=2661892
我的问题是我不理解算法中的公式,或者是其中一个公式的精确符号,而且我在R或Python中实现它时遇到了困难。它似乎是某种指数式的公式,但我在数学书籍中找不到任何关于它的东西。也不确定半无穷大的标志。我认为它意味着成比例,但这是否意味着价值分配,或者什么?任何指针都将非常感激。
答案 0 :(得分:0)
(你真的应该发表在数学或计算机科学上;你试图理解算法本身,而不是算法的实现。一个很大的缺点是Stack Overflow不允许LaTeX,所以请原谅阅读下面的内容。)
能够使用与#34;成比例的" symbol \ propto,你需要考虑表达式的左边是概率。
您可以使用以下作为"定义" \ propto:
P(X = x)\ propto f(x)< => P(X = x)= f(x)/(\ sum_ {x'} f(x'))
也就是说,P(X = x)与f(x)成比例,当用f(x')之和归一化时,所有值x'随机变量X。
例如,如果一个骨灰盒包含10个蓝色球和20个红色球,则绘制给定颜色的球的概率与该颜色的球的数量成比例。由于概率之和需要为1,这意味着按以下方式对它们进行标准化:
P(颜色=蓝色)\ propto 10
P(颜色=红色)\ propto 20
P(颜色=蓝色)= 10 /(10 + 20)= 1/3
P(颜色=红色)= 20 /(10 + 20)= 2/3。
现在,在您正在使用的论文中,他们使用非常紧凑的符号\ nu ^ t_ {i,v,j}作为随机变量及其值。在不知道论文的其余部分的情况下,我猜测\ nu ^ t_ {i,v,j}代表P(R ^ t_ {i,j} = v),即索引t,i和j表示正在谈论哪个随机变量R ^ t_ {i,j}(他们没有明确地在那里命名随机变量,所以为了清楚起见我只是在这里使用名称R),而索引v代表该随机变量的值。但是,在假设索引v代表值的情况下,检查我是否正确会更好。
如果这个假设是正确的,那么这个表达意味着
\ nu ^ t_ {i,v,j} = f(v)/ sum_v' F(V&#39)
其中f代表表达式的右侧。
自然地,对于每个t,i,j,更有效的计算方法是为每个值v计算f(v)并将其存储在以v为索引的数组中,随时累积它们的总和,并且然后简单地将数组中的每个值除以最终总和。