我有一个包含以下数据的数据文件:
10 CLARK,1,265, KING,3,2145, MILLER,2,255
20 ADAMS,2,234, FORD,2,141, JONES,2,425, SCOTT,3,346, SMITH,4,252
30 ALLEN,2,141, BLAKE,3,2145, JAMES,2,255, MARTIN,2,255, TURNER,2,255, WARD,2,255
我需要将它们存储在配置单元表中。由于这些值正在验证,请建议我如何创建一个表来存储这些记录。
任何帮助都会很棒!
答案 0 :(得分:0)
您可以做两件事:
如果最大列数是固定的(比如最多20个),那么你有一个包含那么多列的hive表。 Hive会自动为任何特定行中不存在的列分配null。
您可以做的其他事情是将每一行存储为字符串,查询时可以拆分该字符串。但是这不会很好,因为每次查询时都必须首先拆分然后再运行查询。