否则说用模式匹配和图遍历替换特征向量并模拟降维?
我的意思是,给定英语单词的语义图计算类似于:
king - man = queen
这意味着我可以从图形中减去一个子图,并根据指标对得到的子图进行评分。
我不认为这将是一个单独的neo4j或gremlin查询。我对与图表数据库中的全局和局部推理有关的底层机制很感兴趣。
答案 0 :(得分:4)
我认为重要的是要记住图形数据库作为存储解决方案之间的区别,然后使用机器学习将连接图提取为表示用于正确训练ML模型的特征的向量。
不同之处在于,您可以以这样的方式构建数据,以便更容易找到适合创建机器学习模型的模式。使用Neo4j做这个当然是一个好主意,但它不是开箱即用的东西。我已经为Neo4j创建了一个插件,它将使用我想到的遗传算法从文本中提取分层模式匹配。你可以看看这里:http://www.kennybastani.com/2014/08/using-graph-database-for-deep-learning-text-classification.html
然后,您可以使用结果数据构建word2vec模型。