如何在neo4j cypher中规范化值

时间:2018-02-28 17:59:54

标签: neo4j cypher cypher-3.1

鉴于结果集,我想规范化一个值。

理想世界查询示例:

match (c)<-[:WORKS_FOR]-(u)-[:KNOWS]->(s)
where s.label = "Test"
with u as users
match (users)-[com:SEND]-(otherUsers)
with  users, sum(com.count) as messages
return users, messages / max(messages)

如何从用户中获取max(messages)?可能UNWIND

1 个答案:

答案 0 :(得分:1)

我们可以稍微改进一下。

首先,您需要在此处使用至少一个标签,以避免执行所有节点扫描。希望您在创建节点时使用标签。如果没有,绝对是开始的,未标记的节点将无法在大多数查询中使用,因为您将使用所有节点扫描。

此外,为了快速进入本地图表,s上的标签会很有用,并且该标签上的索引及其label属性(与实际标签不同) ,只是你知道)。

接下来,如果要确保节点至少有一个关系,最好为其使用WHERE,而不是将其包含在匹配中。这也可以减少基数问题(例如,如果用户为多家公司工作),这可能会使您的结果和后续工作量增加(以及抛弃查询的其他部分)。

至于如何在所有用户之间聚合max(messages),你还需要聚合其他变量,这有点烦人,但没办法解决它。

另外,我更喜欢在大多数变量中使用单数形式,并且只对集合使用复数形式,这有助于避免混淆。

这是一个提供更改的示例(假设s也是:用户并且有一个索引:User(label)):

match (user:User)-[:KNOWS]->(s:User)
where s.label = "Test" and ()<-[:WORKS_FOR]-(user)
match (user)-[com:SEND]-()
with  user, sum(com.count) as messages
with collect({user:user, messages:messages}) as usersInfo, 1.0 * max(messages) as total
unwind usersInfo as userInfo
return userInfo.user as user, userInfo.messages / total as percentage