我尝试在嵌入模式下更改apache钻取中的存储配置,以识别标头并更改csv文件的分隔符。我还将新格式类别从csv重命名为sap。
我尝试使用文档中的信息并创建了以下json存储信息:
{
"type": "file",
"enabled": true,
"connection": "file:///",
"workspaces": {
"root": {
"location": "/",
"writable": false,
"defaultInputFormat": null
},
"tmp": {
"location": "/tmp",
"writable": true,
"defaultInputFormat": null
}
},
"formats": {
"sap": {
"type": "text",
"extensions": [
"sap"
],
"skipFirstLine": false,
"extractHeader": true,
"delimiter": "|"
},
"psv": {
"type": "text",
"extensions": [
"tbl"
],
"delimiter": "|"
},
"csv": {
"type": "text",
"extensions": [
"csv"
],
"delimiter": ","
},
"tsv": {
"type": "text",
"extensions": [
"tsv"
],
"delimiter": "\t"
},
"parquet": {
"type": "parquet"
},
"json": {
"type": "json"
},
"avro": {
"type": "avro"
}
}
}
但是当我尝试将它保存在web-ui中时,我得到了消息:错误(无效的json映射)。
exec.storage.enable_new_text_reader设置为true。
有人可以帮助我如何添加两个配置项:skipFirstLine和extractHeader吗?
BR
答案 0 :(得分:0)
Drill能够在Drill 1.3 中解析文本文件(CSV,TSV等)中的标题行。请检查documentation。
检查Release notes for Dill 1.3和csv标头解析issue以获取更多详细信息。