我要创建一个管道分离值(psv)文件的当前方法是首先使用类似
的查询创建一个视图创建视图ABC为 选择第1列|| '|' ||第2栏|| '|' || ..
然后使用!记录从ABC中选择*。
由于我需要生成的文件有100列,这导致了大量的开发时间和错误。
有没有一种简单的方法可以解决这个问题?
答案 0 :(得分:0)
在您的存储插件中创建自定义格式。 这是文档 https://drill.apache.org/docs/plugin-configuration-basics/
"formats": {
"psv": {
"type": "text",
"extensions": [
"tbl"
],
"delimiter": "|"
}
}
更改会话以设置默认商店
alter session set `store.format`='psv';
使用CTAS以上述指定格式写入数据
create table `users.vgunnu`.`vt_del_test` as select * from dfs.root.`/tmp/test_parquet` limit 3;
格式的更多信息 http://drill.apache.org/docs/create-table-as-ctas-command/