标签: indexing redis cassandra bigdata
我有超过 200 万个 ID,每个 ID 表示为 10 个字符的字符串。这些 ID 对应于将由多台机器处理的文档。创建用于跟踪已处理 ID 的共享索引的正确方法是什么?
Cassandra 是适合使用的工具还是过度杀伤?
频繁的操作将是:
(1) 为索引添加 ID。
(2) 检查索引中是否存在 ID。