我的问题是由以下问题引起的。 我有一组Web文档,我从中提取关键字。我想将这些数据存储在Neo4j中以供进一步分析(或多或少的图形挖掘,包括子图同构问题):每个web文档都是一个节点;从一个Web文档到另一个Web文档的超链接是相应的指向关系;关键字是节点的属性。在此设置中,关键字属性可能归因于多个节点(我希望这是可行的)。
我需要帮助解决以下问题(我知道只有非常基本的Neo4j问题才能回答这些问题):
1)是否可以选择属于特定属性“keyword1”的所有节点?
2)如何为2个节点“doc1”和“doc2”选择常用(重叠)关键字属性?即2个网络文件的常用关键字
3)为关键字属性创建某种字符串键是否更好(而不是使用默认的自动递增整数)?
任何提示/建议/链接都将受到高度赞赏。 我在Windows上使用Neo4j的Python绑定。
答案 0 :(得分:1)
全局查找由索引处理。您应该构建一个包含两个关键字的索引,由lucene支持,然后您可以在节点上询问组合查询。
http://docs.neo4j.org/chunked/snapshot/tutorials-java-embedded-index.html
http://docs.neo4j.org/chunked/snapshot/rest-api-indexes.html