我目前正在使用R ergm
包处理社交网络数据。我想估计在两个不同变量上具有同音性的平局的条件概率,但取决于我如何指定模型,结果略有不同。
在第一种情况下,我在我的模型中放了两个nodematch
项,每个感兴趣的变量一个,我通过总结我的3个系数找到双重嗜同性条带的条件对数 - 奇数model(“edge”术语和两个nodematch
术语)。
在第二种情况下,我直接指定一个nodematch
项,因为两个变量都是同音的。
我得到的结果虽然接近但仍然不同,但在这两种情况下,我都应该得到在共享这两种属性的个体之间发生平局的对数奇数。
以下是Sampson数据的一个例子:
# Load the data :
library(statnet)
data(sampson)
#First model: I specify two nodematch terms, one for 'cloisterville' and one for 'group'.
m1 <- ergm(samplike ~ edges + nodematch('cloisterville') + nodematch('group'))
#Second model: this time, I have only one term asking for a `nodematch` on both terms at the same time.
m2 <- ergm(samplike ~ edges + nodematch(c('cloisterville','group')))
#Here is the output of both models:
summary(m1)
summary(m2)
因此,根据第一个模型,两个变量上的同质关系的条件对数奇数应为:
-2.250 + 0.586 + 2.389
即0.725
然而,根据第二个模型,这个相同的双同性关系的对数奇数应该是:
-1.856 + 2.659
即0.803
对应概率为0.6737071和0.6906158
你知道为什么两种情况下的结果都不同,而它应该给出相同类型领带的相同条件概率吗?
非常感谢你的帮助,
亲切的问候
Timothée
答案 0 :(得分:1)
我们应该不期望相同的结果,因为模型正在评估两个不同的东西。从本质上讲,模型1正在评估group
上的cloisterville
或上的同音异形,而模型2则同时评估group
和上的同音异义。 group
。
更确切地说,第一个模型在cloisterville
上同性恋测试,净?ergm.terms
上的同性恋倾向,反之亦然。第二个模型着眼于两个属性同时存在同性恋倾向。僧侣是否在群体内部并根据他们在回廊中的位置形成联系?
请参阅nodematch
中cloisterville==TRUE
的说明:
(当给出多个名称时,统计数据仅计算所有命名属性匹配的名称。)
这很容易看到:
颜色是组。正方形表示cloisterville==FALSE
,三角表示nodematch(c('cloisterville','group'))
。术语{{1}}仅计算颜色和形状匹配的边缘!