我的数据采用适当的格式,没有Apache支持的数据。 有没有关于如何编写我自己的存储插件来处理这些数据的教程。
答案 0 :(得分:11)
这确实应该在文档中,但目前不是。界面不是太复杂,但是看一下现有的插件并理解正在发生的一切可能有点多了。
编写存储插件有两个主要组件,将信息公开给查询规划器和模式管理系统,然后实际实现从数据源API到钻取记录表示的转换。
最近添加了Kudu插件,对于具有Drill可以利用的许多元素的存储系统来说,它是一个合理的模型。我要注意的一件事是,如果您的存储系统没有分发,并且您只是计划进行所有远程读取,则不必在组扫描中对关联性/工作列表/分配进行大量工作。如果我有一段时间不久,我将尝试在界面的不同部分编写一个文档,并可能编写一个关于现有插件的教程。