我必须解决一个问题。我有2,3个网站,它们之间有很多连接。我必须在2个网址之间找到更短的路。 但是在开始时我需要s.th来映射这个站点并制作我可以使用的Adjacency列表。每行应包含一个页面以及从那里开始的所有连接。 我需要可以进行扫描的软件,或者我应该编写这样的软件。 例如,它不会像php curl那么困难。 :)
答案 0 :(得分:0)
也许您需要将您的连接想象成图形节点并使用它进行计算?在新闻网站(http://topbitcoinnews.com)中检测命名实体的大新闻网站,我们使用相同的方法并将我们的数据存储在neo4j.org中