我遇到的问题超出了我的理解范围。 我已经为你做了一个简单的可重复的例子来测试它。
基本上我创建了一个贝叶斯网络,其中包含两个链接在一起的强相关变量。人们会期望,如果其中一个很高,另一个也应该是(因为它们直接相关)。
library(bnlearn)
Learning.set4 = cbind(c(1,2,1,8,9,9),c(2,0,1,10,10,10))
Learning.set4 = as.data.frame(Learning.set4)
colnames(Learning.set4) = c("Cause","Cons")
b.network = empty.graph(colnames(Learning.set4))
struct.mat = matrix(0,2,2)
colnames(struct.mat) = colnames(Learning.set4)
rownames(struct.mat) = colnames(struct.mat)
struct.mat[1,2] = 1
bnlearn::amat(b.network) = struct.mat
haha = bn.fit(b.network,Learning.set4)
# Here we get a mean that is close to 10
seems_logic_to_me=cpdist(haha, nodes="Cons",
evidence=list("Cause"=10), method="lw")
# Here I get a mean that is close to 5, so a high value
# of Cons wouldn't mean anything for Cause?
very_low_cause_values = cpdist(haha, nodes="Cause",
evidence=list("Cons"=10), method="lw")
有人可以在这里告诉我它不适用于lw
方法的原因吗? (您可以尝试ls
,它似乎工作正常。)
lw
代表可能性加权
更新: 得到了维护者的解决方案。 最后添加以下内容将打印预期的预测:
print (sum(very_low_cause_values[, 1] * attr(very_low_cause_values, "weights")) / sum(attr(very_low_cause_values, "weights")))