我使用R脚本在HDFS中添加了一个CSV文件。
我使用新的CSV /附加数据更新此CSV
通过此CSV在Hive中使用hue创建表。
将其改为外部表格。
现在,如果在hdfs位置更改数据,是否会在hive表中自动更新数据?
答案 0 :(得分:2)
这就是Hive中外部(也包括托管)表的问题。他们不是真正的桌子。您可以将它们视为HDFS位置的链接。因此,无论何时查询外部表,Hive都会从您创建此表时选择的位置读取所有数据。
来自Hive doc:
EXTERNAL表指向其存储的任何HDFS位置 而不是存储在配置属性指定的文件夹中 hive.metastore.warehouse.dir。