ArangoDB - 如何使用图形实现自定义推荐引擎?

时间:2016-02-28 08:56:55

标签: graph arangodb aql

假设我们有一个食品项目数据库,例如:

item1 = {name: 'item1', tags: ['mexican', 'spicy']};
item2 = {name: 'item2', tags: ['sweet', 'chocolate', 'nuts']};
item3 = {name: 'item3', tags: ['sweet', 'vanilla', 'cold']};

我们有一位用户正在寻找食物推荐,他们会在某些标签上显示他们的偏好权重:

foodPref = {sweet: 4, chocolate: 11}

现在我们需要计算每个项目得分的好坏并推荐最佳项目:

item1 score = 0 (doesn't contain any of the tags user is looking for)
item2 score = 4 (contains the tag 'sweet')
item3 score = 15 (contains the tag 'sweet' and 'chocolate')

我已将问题建模为图表:sample graph

获取建议的正确方法是什么 - 自定义遍历对象或仅使用AQL过滤和计数或仅在Foxx(javascript层)中实现它?

另外,您可以帮忙解决您建议的方法的示例实现吗?

提前致谢!

1 个答案:

答案 0 :(得分:2)

首先,让我们按照您指定的方式创建集合及其内容。我们将添加第二个用户。

db._create("user")
db._create("tags")
db._create("dishes")

db.user.save({_key: 'user1'})
db.user.save({_key: 'user2'})

db.tags.save({_key: 'sweet'})
db.tags.save({_key: 'chocolate'})
db.tags.save({_key: 'vanilla'})
db.tags.save({_key: 'spicy'})

db.dishes.save({_key: 'item1'})
db.dishes.save({_key: 'item2'})
db.dishes.save({_key: 'item3'})

现在让我们创建边缘集合及其边缘:

db._createEdgeCollection("userPreferences")
db._createEdgeCollection("dishTags")

db.userPreferences.save("user/user1", "tags/sweet", {score: 4})
db.userPreferences.save("user/user1", "tags/chocolate", {score: 11})
db.userPreferences.save("user/user2", "tags/sweet", {score: 27})
db.userPreferences.save("user/user2", "tags/vanilla", {score: 7})

db.dishTags.save("tags/sweet", "dishes/item2", {score: 4});
db.dishTags.save("tags/sweet", "dishes/item3", {score: 7})
db.dishTags.save("tags/chocolate", "dishes/item2", {score: 2})
db.dishTags.save("tags/vanilla", "dishes/item3", {score: 3})
db.dishTags.save("tags/spicy", "dishes/item1", {score: 666})

我们的关系是这样的:

user-[userPreferences]->tags-[dishTags]->dishes

可以使用此查询找出user1喜欢的内容:

FOR v, e IN 1..2 OUTBOUND "user/user1" userPreferences, dishTags
  RETURN {item: v, connection: e}

如果你现在想要找到user1最喜欢的所有菜肴:

FOR v, e IN 2..2 OUTBOUND "user/user1" userPreferences, dishTags 
  FILTER e.score > 4 RETURN v

我们会过滤score属性。

现在我们想要找到与user1具有相同首选项的其他用户:

FOR v, e IN 2..2 ANY "user/user1" userPreferences RETURN v

我们进入ANY方向(前进和后退),但只对userPreferences边缘集合感兴趣,否则2..2也会提供使用菜肴。我们现在这样做的方式。我们回到用户集合中以查找具有类似偏好的用户。

创建Foxx服务是否是一个不错的选择取决于个人喜好。 Foxx很棒,如果你想要结合&在服务器端过滤结果,因此客户端通信较少。如果您希望将应用程序放在微服务之上而不是db-queries上,也可以使用它。然后,您的应用程序可以不使用特定于数据库的代码 - 它只有operates with the microservice作为其后端。可能有Foxx

的用例

一般来说,没有“正确”的方式 - 由于性能,代码清洁度,可扩展性等原因,您可能会有不同的方式优先于其他方式。