我将数据库从mongodb迁移到dynamodb并尝试了解最佳做法,尤其是使用辅助本地索引和排序键时。
我的应用程序从Web中提取html数据,并将数据加载到多个表/集合中。在提取时,它为每个项目提供extracted_id
,这是它所从的网站所独有的。在加载项目之前,它为每个项目提供UUID作为其主要/分区键。
问题:为了避免将不同的uuids分配给同一个extracted_id
我查询数据库以检查实体是否具有预先存在的entity_uuid
。
当前解决方案:目前在mongodb中,我有两组表/集合。一个用于存储所有项目,一个用于存储实体extracted_id
(作为关键字) / entity_uuid
(作为值)查找表
更好的解决方案?:当我迁移到DynamoDB时,最好只创建一个extracted_id
作为本地二级索引的数据库,以便不存储重复数据?我不确定文档是否向use indexes sparingly.说明,除了为某个网站提供extracted_id
项目之外,我不会使用uuid
。
希望这是有道理的,我是AWS / DynamoDB的新手,并会感谢所提到的任何提示/更好的解决方案。