我有一个带有用户和组的neo4j数据集。
MATCH (user:User)-[r:Memberof]->(group:Group) RETURN *
现在,我想rate
每个组与其他所有组的共同点,以确定所有组之间的相似度百分比(A组与B组共享95%的会员资格,B组与82%的会员拥有相同的会员资格C等)
尚不知道从哪里开始,请提供任何帮助! :)
答案 0 :(得分:1)
Neo4j Graph Algorithms Library中有一些用于检查相似性的图算法。
Jaccard Similarity algorithm 看起来很适合此用例。 Jaccard相似度算法可用于找出两件事之间的相似度。
还有另外一种可用于相似性的算法, Overlap Similarity algorithm 。重叠相似度算法可用于找出哪些事物是其他事物的子集。
您可以找到有关所有可用的 Similarity algorithms on Neo4j Documentation page 的更多详细信息和一些好的示例。您可以参考上一页的示例,并根据需要编写Cypher查询。
答案 1 :(得分:0)
match (user:User)-[:Memberof]->(group:GroupA)
WITH COUNT(user) AS NUM_A, user
Match (user)-[:Memberof]->(group:GroupB)
RETURN COUNT(user) AS NUM_B, NUM_A
您可以通过这种方式匹配单个组
答案 2 :(得分:0)
感谢拉吉
通过以下查询进行管理。...
MATCH (user:User)-[:MemberOf]->(group:Group)
WITH {item:id(group), categories: collect(id(user))} as userData
WITH collect(userData) as data
CALL algo.similarity.jaccard.stream(data, {similarityCutoff: 0.9})
YIELD item1, item2, count1, count2, intersection, similarity
RETURN algo.asNode(item1).name AS from, algo.asNode(item2).name AS to, intersection, (similarity * 100) AS match