使用单列查询文本文件

时间:2016-06-06 21:26:37

标签: apache-drill

我有一个如下文字文件。

Id
126744
126745
126746
126747
126748

当我使用apache drill发出查询时,

SELECT count(Id) AS COUNT from dfs.root.`/outputfiles/Job_62/riskitem/timeelement_*.txt`

我收到错误:

  

SYSTEM ERROR:IndexOutOfBoundsException:index:23296,length:4(expected:range(0,16384))

我如何让它发挥作用。其他CSV文件的分隔符为,但此文件没有。依靠分隔文件正在运行。

1 个答案:

答案 0 :(得分:1)

我的观察

钻取版本==> 1.5

插件的有用部分:

 "csv": {
      "type": "text",
      "extensions": [
        "csv"
      ],
      "extractHeader": true,
      "delimiter": ","
   }

CSV文件(drill_sample.csv)

Id
126744
126745
126746
126747
126748

查询:

 select count(Id) as cnt from dfs.`/home/impadmin/drill_*.csv`;

输出:

  

5

编辑:我也尝试过20,000和5,00,000条记录。结果如预期。