有人可以帮我为这个以Parquet格式处理和存储的数据集创建Hive DDL。
属性:
{
"freq": "8600",
"id": "23266",
"array": [
{
"ver": "201.0.0.F",
"key_ver": "201.0.0.F",
"key": "001I1SS",
"code": "ACDEE",
"prod_code": "DSADVVSS",
"prod_key": "001123"
}
],
"ipm": null,
"offline": "1234234209600"
}
答案 0 :(得分:1)
CREATE TABLE my_table(freq INT, id INT, array<struct<ver: FLOAT, key_ver: FLOAT, key: STRING, code: STRING, prod_code: STRING, prod_key: INT>>, ipm: **UNKOWN**, offline: BIGINT>
由于JSON的类型比Hive少很多,因此我们无法从您发布的内容中获取所需的所有信息。例如,我们不知道ipm
的类型应该是什么,我们不知道id
应该是INT
还是BIGINT
等等
由于您已经将该JSON文件转换为Parquet文件,因此您可以检查Parquet文件(其中包含更多类型)以更好地了解要使用的Schema。