Question

我有一个带有用户和组的neo4j数据集。

MATCH (user:User)-[r:Memberof]->(group:Group) RETURN *

现在，我想rate每个组与其他所有组的共同点，以确定所有组之间的相似度百分比（A组与B组共享95％的会员资格，B组与82％的会员拥有相同的会员资格C等）

尚不知道从哪里开始，请提供任何帮助！：）

Answer 1

Neo4j Graph Algorithms Library中有一些用于检查相似性的图算法。

Jaccard Similarity algorithm 看起来很适合此用例。 Jaccard相似度算法可用于找出两件事之间的相似度。

还有另外一种可用于相似性的算法， Overlap Similarity algorithm 。重叠相似度算法可用于找出哪些事物是其他事物的子集。

您可以找到有关所有可用的 Similarity algorithms on Neo4j Documentation page 的更多详细信息和一些好的示例。您可以参考上一页的示例，并根据需要编写Cypher查询。

Answer 2

match (user:User)-[:Memberof]->(group:GroupA)
WITH COUNT(user) AS NUM_A, user
Match (user)-[:Memberof]->(group:GroupB)
RETURN COUNT(user) AS NUM_B, NUM_A

您可以通过这种方式匹配单个组

Answer 3

感谢拉吉

通过以下查询进行管理。...

MATCH (user:User)-[:MemberOf]->(group:Group)
WITH {item:id(group), categories: collect(id(user))} as userData
WITH collect(userData) as data
CALL algo.similarity.jaccard.stream(data, {similarityCutoff: 0.9})
YIELD item1, item2, count1, count2, intersection, similarity
RETURN algo.asNode(item1).name AS from, algo.asNode(item2).name AS to, intersection, (similarity * 100) AS match

密码查询以测试关系的共通性

3 个答案: