如何访问pentaho中的hive表

时间:2014-03-03 12:50:06

标签: mongodb hadoop hive pentaho

我使用了pentaho数据集成4.4.0并使用mongo hadoop连接器using this 我成功创建了hadoop和mongo连接。然后我安装了hive 0.11.0并使用上面的链接我成功创建了hive和mongo连接。在我的mongo中包含一个数据库名称为pentaho,我在hive名称中创建了数据库作为demo并使用以下命令创建了新表名为pentho

CREATE TABLE pentaho
( 
  id INT,
  region STRING,
  year INT,
  q1 INT,
  q2 INT,
  q3 INT,
  q4 INT
)
STORED BY 'com.mongodb.hadoop.hive.MongoStorageHandler'
WITH SERDEPROPERTIES('mongo.columns.mapping'='{"id":"_id"}')
TBLPROPERTIES('mongo.uri'='mongodb://localhost:27017/pentaho.sales');

然后我在hive shell上编写了select * from pentaho;命令,它显示了销售集合中的所有记录。   然后我在pentaho中使用hadoop hive数据源集主机创建模型作为localhost数据库名称作为demo并将端口作为10000并单击测试然后它显示弹出连接成功。但是,当我点击确定然后新的即将出现的弹出窗口选项,如模式,表,视图,同义词,但在表中不包含我在蜂巢中创建的任何表。那么怎样才能访问pentaho数据源中的hive表?

1 个答案:

答案 0 :(得分:0)

一段时间后,我发现了我丢失的地方,我在本地的hadoop conf / mapred-site.xml文件中设置了我将端口设置为localhost:9001,当我启动双服务器时,用于hsql的端口相同。然后更改mapred-site.xml端口而不是9001它工作正常。 :)