如何在大数据中创建代理键

时间:2015-03-24 05:06:54

标签: bigdata

我们计划将交易数据移至BigData平台并在那里进行分析。我们面临的一个挑战是如何在bigData中创建自动增量。我们需要它来生成代理键。

2 个答案:

答案 0 :(得分:1)

最常见的方法是使用type 3 UUID,即具有极低,极低碰撞机会的伪随机标识符。

如果由于某种原因确实需要顺序(或至少是单调)标识符,则需要从单个源生成它们,并且可能需要将此单个源作为服务分离出来,例如: Twitter Snowflake

答案 1 :(得分:0)

是。我同意UUID方法。

  

但请确保您重构ER模型,以便在规范化和非规范化实体之间取得适当的平衡。

如果你像在BigData架构中那样移动现有的应用程序ER模型,那么它会降低性能,因为它可能需要与BigTable进行连接。

  

另外,请确保您知道访问数据的密钥很强,并且在存储NoSql数据库时更新数据时不会更改

这个链接会让你对上面的内容有所了解