我正在使用非常大型无向图(来自电信公司的社交网络)。
我在此图表上应用了聚类算法,以找到最相关的社区。问题是算法非常慢,我需要用较小的图来测试它以调整一些参数。
最近,我想到了从这张大图中获取样本的想法。此示例必须代表原始图表。
是否有人知道获取该样本的最佳算法?什么应该是样本的最小尺寸(is it 15%?)?
我已经阅读了一些关于大型有向图(使用多维随机游走进行估算和采样图以及从大图进行采样)的采样的文章,并且似乎没有任何文章关于无向图。
如果您需要更多信息,请告诉我。
非常感谢,
DC
答案 0 :(得分:1)
您可以将无向图视为有向图,以便进行采样。假定允许循环,有向图的任何采样策略都应该有效。您只需要对节点和边进行采样,因此任何成为样本一部分的边都可以接受两个方向的边。