密码查询以测试关系的共通性

时间:2019-04-18 13:23:52

标签: neo4j cypher graph-algorithm

我有一个带有用户和组的neo4j数据集。

MATCH (user:User)-[r:Memberof]->(group:Group) RETURN *

现在,我想rate每个组与其他所有组的共同点,以确定所有组之间的相似度百分比(A组与B组共享95%的会员资格,B组与82%的会员拥有相同的会员资格C等)

尚不知道从哪里开始,请提供任何帮助! :)

3 个答案:

答案 0 :(得分:1)

Neo4j Graph Algorithms Library中有一些用于检查相似性的图算法。

Jaccard Similarity algorithm 看起来很适合此用例。 Jaccard相似度算法可用于找出两件事之间的相似度。

还有另外一种可用于相似性的算法, Overlap Similarity algorithm 。重叠相似度算法可用于找出哪些事物是其他事物的子集。

您可以找到有关所有可用的 Similarity algorithms on Neo4j Documentation page 的更多详细信息和一些好的示例。您可以参考上一页的示例,并根据需要编写Cypher查询。

答案 1 :(得分:0)

match (user:User)-[:Memberof]->(group:GroupA)
WITH COUNT(user) AS NUM_A, user
Match (user)-[:Memberof]->(group:GroupB)
RETURN COUNT(user) AS NUM_B, NUM_A

您可以通过这种方式匹配单个组

答案 2 :(得分:0)

感谢拉吉

通过以下查询进行管理。...

MATCH (user:User)-[:MemberOf]->(group:Group)
WITH {item:id(group), categories: collect(id(user))} as userData
WITH collect(userData) as data
CALL algo.similarity.jaccard.stream(data, {similarityCutoff: 0.9})
YIELD item1, item2, count1, count2, intersection, similarity
RETURN algo.asNode(item1).name AS from, algo.asNode(item2).name AS to, intersection, (similarity * 100) AS match