需要帮助从钻取查询HDFS

时间:2015-08-20 11:20:32

标签: apache hadoop hdfs apache-drill

我的笔记本电脑中安装了钻头和zookeeper。我在笔记本电脑中启动了HDFS,看到我可以查询HDFS中的csv和json文件。现在我想查询另一台笔记本电脑中的文件。因此我在另一台笔记本电脑上启动了hdfs,当我发出select *查询时,它失败了(尽管我可以执行show files查询而没有问题)。

我收到的错误在Dropbox链接中:

https://www.dropbox.com/s/5bgyw4jetweczoj/drill.log?dl=0

两台笔记本电脑都运行Ubuntu

Apache钻孔版本:1.1.0

我有以下问题:

1)是否可以在hadoop集群外的机器上运行钻取并查询集群中的hdfs文件?

2)如果是,是否需要进行额外的配置更改?

1 个答案:

答案 0 :(得分:1)

是的,可以在hadoop集群外的机器中运行钻取并查询集群中的hdfs文件。从命令行启动钻取shell(sqlline)并指定要连接的zookeeper仲裁。见Using an Ad-Hoc Connection to Drill。您也可以使用SQuirrel进行连接。 Configuration for Windows与Linux类似。