给定加权有向图的邻接矩阵A(因此矩阵元素不仅仅是0/1且矩阵不对称),是否有任何好的方法来预测新边缘?
我有一个非常大的(数十亿个节点)数据集,其中某些连接具有已知边缘,未观察到的连接具有NULL值,我想使用已知边缘来预测未观察到的连接。
如果方法不精确,那就好了 - 实际上,如果预测值低于某个阈值,我想保持边缘为NULL或0,只是为了使数据大小和处理速度尽可能稀疏。
有什么想法吗?
答案 0 :(得分:1)
您可能希望深入研究随机图生成和图形挖掘文献,特别是在无标度网络上工作。快速的互联网搜索产生了一些可能相关的论文。
An overview现实世界的动态网络及其属性,合适的模型和分析技术。
The seminal paper关于无标度网络。
This survey article侧重于可在合成图生成中利用的真实图的属性。
This paper解决了作者声称在大型真实世界图表中频繁出现的致密化和缩小的直径。测试用例被引用。
This paper明确表示会生成合成社交网络图。
将给定的引用视为有些随意的选择。我期待大量的相关资源。
我自己的一些粗略的高层次想法:你是否有关于实际图的(统计)属性,权重的总量度量或它们的统计分布的任何信息?你有关于采样策略属性的任何信息(特别是偏见)吗?你的观察结果有时间标记吗?
如果您有统计模型,请查看最大似然估计。如果你到目前为止只有观察到的连接,并且你可以假设它们是iid,你可以将一个bootstrap方法应用于你的观察集来估计图形属性的统计数据(例如,度/的均值/方差/等)连通性/周长/重量等)。根据所讨论的措施,这条轨道可能过度 - 假设您的观察结果没有偏差,而是根据给定的图形来计算度量。
将此信息提供给随机图形生成器,该生成器允许使用启动图进行初始化。
希望这个大纲有所帮助,因为它有雾。最好的问候。