任何人都可以告诉我,HCatalog在使用之前是否需要安装?或者它可以用作jar文件?
我让Cloudera在VM上运行,我可以使用HCatalog来完成我的MR工作,Pig,Hive没有问题。我认为相同的MR代码可以与另一个hadoop安装平台一起使用,但显然并非如此,HCatInputFormat.setInput()抛出异常。当我使用Pig -useHCatalog
时,我被提示用法错误,这意味着它不知道-useHCatalog
作为参数是什么。
之前没有考虑到这一点,因为在Cloudera上使用HCatalog ...
答案 0 :(得分:0)
是的,您需要安装并启动HCatalog服务器。 HCatalog应该附带最新的Hive tar包。
点击Apache Hive documentation查看详细信息,
基本上你需要,
为HCatalog设置MySQL数据库
运行服务器安装脚本
share / hcatalog / scripts / hcat_server_install.sh -r root -d dbroot -h hadoop_home -p portnum
启动HCatalog服务器
导出HIVE_HOME = hive_home $ HIVE_HOME / sbin / hcat_server.sh start
答案 1 :(得分:0)
如前所述,如果您使用的是hive 0.12或更高版本,则无需单独安装hcatalog。