每当我输入任何记录时,我想为我的 hive 表添加一个唯一值,该值不应在整个hive表中重复。我无法找到任何解决方案或任何功能。在我的情况下,我想使用 pig 拉丁语在hive中输入记录。请帮忙。
答案 0 :(得分:0)
HIVE不提供类似约束的RDBMS数据库。
使用PIG Script建议的approch如下。 1.加载数据 2.将DISTINCT应用于数据 3.将数据存储在某个位置 4.在同一位置创建外部配置单元表。
如果您可以使用HCATALOG,可以将步骤3和4组合在一起,这样可以直接在Hive表中存储数据。
答案 1 :(得分:0)