Question

我尝试在嵌入模式下更改apache钻取中的存储配置，以识别标头并更改csv文件的分隔符。我还将新格式类别从csv重命名为sap。

我尝试使用文档中的信息并创建了以下json存储信息：

{
 "type": "file",
 "enabled": true,
 "connection": "file:///",
 "workspaces": {
  "root": {
    "location": "/",
    "writable": false,
    "defaultInputFormat": null
  },
  "tmp": {
  "location": "/tmp",
  "writable": true,
  "defaultInputFormat": null
  }
},
  "formats": {
    "sap": {
     "type": "text",
     "extensions": [
       "sap"
     ],
     "skipFirstLine": false,
     "extractHeader": true,
     "delimiter": "|"
   },
   "psv": {
    "type": "text",
    "extensions": [
       "tbl"
    ],
    "delimiter": "|"
   },
   "csv": {
     "type": "text",
     "extensions": [
       "csv"
     ],
   "delimiter": ","
   },
   "tsv": {
     "type": "text",
     "extensions": [
       "tsv"
      ],
     "delimiter": "\t"
   },
   "parquet": {
      "type": "parquet"
   },
   "json": {
     "type": "json"
   },
   "avro": {
      "type": "avro"
   }
}
}

但是当我尝试将它保存在web-ui中时，我得到了消息：错误（无效的json映射）。

exec.storage.enable_new_text_reader设置为true。

有人可以帮助我如何添加两个配置项：skipFirstLine和extractHeader吗？

BR

Answer 1

Drill能够在Drill 1.3 中解析文本文件（CSV，TSV等）中的标题行。请检查documentation。

检查Release notes for Dill 1.3和csv标头解析issue以获取更多详细信息。

Apache Drill JSON存储配置错误（无效的json映射）

1 个答案: