我有一个如下文字文件。
Id
126744
126745
126746
126747
126748
当我使用apache drill发出查询时,
SELECT count(Id) AS COUNT from dfs.root.`/outputfiles/Job_62/riskitem/timeelement_*.txt`
我收到错误:
SYSTEM ERROR:IndexOutOfBoundsException:index:23296,length:4(expected:range(0,16384))
我如何让它发挥作用。其他CSV文件的分隔符为〜,但此文件没有。依靠〜分隔文件正在运行。
答案 0 :(得分:1)
钻取版本==> 1.5
插件的有用部分:
"csv": {
"type": "text",
"extensions": [
"csv"
],
"extractHeader": true,
"delimiter": ","
}
CSV文件(drill_sample.csv)
Id
126744
126745
126746
126747
126748
查询:
select count(Id) as cnt from dfs.`/home/impadmin/drill_*.csv`;
输出:
5
编辑:我也尝试过20,000和5,00,000条记录。结果如预期。