在阅读Michael Hunger创建的Natural Language Analytics made simple and visual with Neo4j博客条目后,提出了这个问题
当一个单词被多个句子使用(或在同一个句子中多次使用)时,该单词将具有两个或更多[NEXT]关系。为了知道每个句子的正确路径,我们需要存储段ID和位置id [sid,idx]
存储一个实例很清楚,它创建一个包含两个值的数组。但是,我们如何添加两个或更多数组?据我所知,neo4j只接受基本数据类型
不是使用这个解决方案,为每个句子路径存储一个[NEXT]关系是否有意义?当然这会对关系产生很大的影响
由于
答案 0 :(得分:1)
注意:在引用的文章中,在“我也想要句子编号和单词位置”部分的查询的最后一行上有一个拼写错误。也就是说,r.pos = r.pos = [sid,idx]
应为:r.pos = r.pos + [sid,idx]
。
在2个集合上使用+
运算符时,最终会得到一个合并2个原始集合内容的集合。因此,如果r.pos
以[1, 2]
开头,则r.pos + [3, 4]
将生成:[1, 2, 3, 4]
。
因此,文章没有“数组数组”的问题。