标签: hadoop
我有一个带有列标题的巨大csv文件。我的问题是,当我将csv文件放入HDFS时,群集中的所有文件都将保留标题,否则标题会更少。
答案 0 :(得分:0)
如果您只是使用命令行或API将文件复制到HDFS,那么是,该文件不会以任何方式更改(将保留标头)。
但是如果你打算将它用作hive表,那么你需要在加载文件之前删除标题,然后创建适当的hive表。