在SQL中实现MHRW算法是否可行且有效?
我想采样一个包含+1百万个节点的直接大图,这似乎是最好的方法之一。该算法的目的是用于非直接图形,但我认为它也适用于有向图形
算法:
v <- initial node
while stop criteria not met do
select node w uniformly at random from neighbors of v;
generate uniformly at random 0<= p <= 1
if p <= (degree of v) / (degree of w)
then v <- w
else
stay at v
end if
end while
我从table1获取初始节点,其中包含所有节点及其属性。在table2中,我有两列显示节点之间的所有连接(以及获取节点度的方法)。停止标准将是样本的大小,即,当样本<= ~100,000个节点时。
最好的问候。