标签: xml hive hdfs hortonworks-data-platform
如何从XML文件创建HIVE表,只有少数特定字段? 例如,我有一个1000个字段的XML文件,但我的HIVE表中只需要100个字段。除此之外。如何将100个字段存储在不同的数据库和不同的表中?
答案 0 :(得分:0)
通常的方法是在XML文件上运行XLST转换并生成1到N个csv文件,这些文件可以存储在HDFS上,然后通过HIVE外部表公开数据,或者在第二阶段加载到ORC / Parquet表。 / p>