支持在Presto中的有限列数之外创建表

时间:2019-08-06 11:44:44

标签: hive presto

我在玩Presto。我上传了10列的镶木地板文件。我想使用presto-cli在5列的元存储中创建表(外部位置s3)。看起来presto不支持此功能吗? 还有其他方法可以使它正常工作。

1 个答案:

答案 0 :(得分:0)

如果您使用的是Parquet或ORC文件格式,那应该很容易实现。这是将元数据与实际数据分开的另一个优点。如评论中所述,您应该使用列名而不是索引来访问字段。

其中一个示例:

CREATE TABLE hive.web.request_logs (
  request_time timestamp,
  url varchar,
  ip varchar,
  user_agent varchar
)
WITH (
  format = 'parquet',
  external_location = 's3://my-bucket/data/logs/'
)

参考:

https://prestodb.github.io/docs/current/connector/hive.html#examples