我有一个CDH4.5群集,我想从其他服务器(例如数据库服务器)上传文件。
使用vanilla Hadoop和Hive,我可以更改配置文件,将namenode和Metastore指向远程服务,然后运行:
dba@db-001$ hadoop fs -copyFromLocal /path/to/export.tsv
dba@db-001$ hive -e "load data local inpath '/path/to/export.tsv' into table test.my_table"
但是CDH怎么样?我应该在其他服务器上安装哪些组件?
答案 0 :(得分:0)
下载与CDH版本对应的hadoop和hive tarball: http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/latest/CDH-Version-and-Packaging-Information/cdhvd_topic_3.html#topic_3_1_unique_7
从cloudera manager下载配置文件,解压缩它们,并将HADOOP_CONF_DIR / HIVE_CONF_DIR指向这些文件夹。