将GZIP HDFS数据复制到vertica中

时间:2014-05-19 14:22:51

标签: database hadoop vertica nosql

我想将HDFS(gzip)数据复制到Vetica中。

我正在使用以下命令。但它不起作用

COPY pix001 SOURCE Hdfs(url =' http://hadoopnemenode.com:50070/webhdfs/v1/bq-upload/pix/m=03/d=01/03-01.txt.gz',username =' xyz')GZIP DELIMITER E' \ t';

任何人都知道更好的方法来做到这一点

由于

3 个答案:

答案 0 :(得分:3)

是的,GZIP支持只需要编译GZIP库[Vertica Guys最终帮助了我:)]

以下是步骤:

  1. #cd / opt / vertica / sdk / examples /
  2. #make
  3. #vsql -f FilterFunctions.sql
  4. dbadmin => CREATE LIBRARY GZipLib AS' /opt/vertica/sdk/examples/build/GZipLib.so' ;;
  5. dbadmin =>创建过滤器GZip AS LANGUAGE' C ++' NAME' GZipUnpackerFactory' LIBRARY GZipLib;
  6. COPY abc002 SOURCE Hdfs(url =' http://hadoop-namenode.com:50070/webhdfs/v1/03-01.txt.gz',username =' xyz')过滤器GZip()DELIMITER E' \ t&#39 ;;

答案 1 :(得分:0)

添加roy回答,

下面给出了制作(构建)的步骤,(#roy回答的第二步)

sudo apt-get install g++ 
sudo apt-get install zlib1g-dev  # for gzip 
g++ -lz -D HAVE_LONG_INT_64 -I /opt/vertica/sdk/include -Wall -shared -Wno-unused-value    -fPIC -o /opt/vertica/sdk/examples/build/GZipLib.so /opt/vertica/sdk/examples/FilterFunctions/GZip.cpp /opt/vertica/sdk/include/Vertica.cpp

提示:-lz标志将zlib库静态链接到GZip.so

Vertica Documentation for compiling UDF

答案 2 :(得分:-1)

从HDFS复制是否支持GZIP?:

https://my.vertica.com/docs/7.0.x/HTML/Content/Authoring/HadoopIntegrationGuide/HDFSConnector/LoadingDataFromHDFS.htm

在任何情况下,我都不会在该文档中看到它。