在配置单元表中添加唯一值

时间:2017-02-17 10:38:31

标签: hive apache-pig auto-increment

每当我输入任何记录时,我想为我的 hive 表添加一个唯一值,该值不应在整个hive表中重复。我无法找到任何解决方案或任何功能。在我的情况下,我想使用 pig 拉丁语在hive中输入记录。请帮忙。

2 个答案:

答案 0 :(得分:0)

HIVE不提供类似约束的RDBMS数据库。

使用PIG Script建议的approch如下。     1.加载数据     2.将DISTINCT应用于数据     3.将数据存储在某个位置     4.在同一位置创建外部配置单元表。

如果您可以使用HCATALOG,可以将步骤3和4组合在一起,这样可以直接在Hive表中存储数据。

官方文档:Link 1 link 2

答案 1 :(得分:0)

你看看这个吗? https://github.com/manojkumarvohra/hive-hilo它似乎提供了一种使用hi / lo算法

在hive中生成序列号的方法