我现在开始使用pgmpy lib进行概率图形模型实现。我使用这个lib的概率与我手动获得的概率不同(例如使用SamIam)。 以下是SamIam制作的非常小的图形模型的屏幕截图,用于检查概念:Student example
我使用pgmpy的代码。
from pgmpy.models import BayesianModel
from pgmpy.factors import TabularCPD
from pgmpy.inference import BeliefPropagation
student_model = BayesianModel([('D', 'G'), ('I', 'G')])
difficulty_cpd = TabularCPD(variable='D', variable_card=2, values=[[0.6, 0.4]])
intel_cpd = TabularCPD(variable='I', variable_card=2, values=[[0.7, 0.3]])
grade_cpd = TabularCPD(variable='G',variable_card=3, values=[[0.3, 0.05, 0.9, 0.5], [0.4, 0.25, 0.08, 0.3], [0.3, 0.7, 0.02, 0.2]], evidence=['I', 'D'], evidence_card=[2, 2])
student_model.add_cpds(grade_cpd, difficulty_cpd, intel_cpd)
print (student_model.nodes())
print (student_model.get_cpds('D'))
print (student_model.get_cpds('I'))
print (student_model.get_cpds('G'))
belief_propagation = BeliefPropagation(student_model)
res = belief_propagation.query(variables=["G"])
print (res['G'])
我得到以下结果code output
+-----+----------+
| G | phi(G) |
|-----+----------|
| G_0 | 0.4470 |
| G_1 | 0.2714 |
| G_2 | 0.2816 |
+-----+----------+
phi(G)的值与Samiam的值不同。
根据Samiam使用的算法,我们应该得到G_0:
P(G_0) = P(G_0|I_0,D_0) + P(G_0|I_0,D_1) + P(G_0|I_1,D_0) + P(G_0|I_1,D_1)
P(G_0) = 0.3*0.7*0.6 + 0.05*0.7*0.4 + 0.9*0.3*0.6 + 0.5*0.3*0.4 = 0.3620
有人可以给我一个关于如何计算这些phi(G)值的提示(实际使用哪种算法),以及我如何获得与SamIam相同的值。