我应该在DynamoDB中使用二级索引还是单独的ID查找表?

时间:2017-04-25 10:14:01

标签: amazon-web-services amazon-dynamodb

我将数据库从mongodb迁移到dynamodb并尝试了解最佳做法,尤其是使用辅助本地索引和排序键时。

我的应用程序从Web中提取html数据,并将数据加载到多个表/集合中。在提取时,它为每个项目提供extracted_id,这是它所从的网站所独有的。在加载项目之前,它为每个项目提供UUID作为其主要/分区键。

问题:为了避免将不同的uuids分配给同一个extracted_id我查询数据库以检查实体是否具有预先存在的entity_uuid

当前解决方案:目前在mongodb中,我有两组表/集合。一个用于存储所有项目,一个用于存储实体extracted_id (作为关键字) / entity_uuid (作为值)查找表

更好的解决方案?:当我迁移到DynamoDB时,最好只创建一个extracted_id作为本地二级索引的数据库,以便不存储重复数据?我不确定文档是否向use indexes sparingly.说明,除了为某个网站提供extracted_id项目之外,我不会使用uuid

希望这是有道理的,我是AWS / DynamoDB的新手,并会感谢所提到的任何提示/更好的解决方案。

0 个答案:

没有答案