是否可以在大图中用并行框架实现全对最短路径算法?

时间:2016-05-12 02:07:49

标签: graph apache-spark

使用spark graphx pregel api,可以很容易地计算大图中的单源最短路径,例如数百万个顶点和数千个边缘,并且具有可接受的运行时间,例如几个小时。但是可以在可接受的运行时间内在大图中运行所有对最短路径吗?

1 个答案:

答案 0 :(得分:6)

具有数百万个顶点的图形可以在单个机器上轻松处理,只要它具有足够的内存,因此无需支付通过扩展和许多现代库引入的惩罚,大大优化并可以利用现代硬件

相比之下,分布式解决方案通常受到节点间通信的限制,并且精确算法不能很好地扩展。通过近似和启发式方法可以显着改善事物,并利用有关数据结构的先验知识。

意见警告)就个人而言,我会尽可能远离Spark上的图形处理:

  • GraphX几年前已被有效放弃。根据{{​​3}}
  • ,它还显示了非常差的缩放功能
  • Grapframes不成熟且效率低下。