如果我们将数据从HDFS加载到Hive表中,那么从本地文件加载数据有什么优势?如果我们将HFDS中的数据加载到Hive中,那么它不是HDFS中的数据复制吗?
答案 0 :(得分:0)
本地到HDFS将会变慢,因为单个庞大的数据块将从本地转移到远程n
个节点。
如果您将HDFS文件复制到配置单元表中,那么将会复制数据,这是默认功能,因为Hive管理自己的目录,如果您不想复制数据,请查看以下答案:Is it possible to import data into Hive table without copying the data