input_lines = LOAD '/inputs/AboutMe' AS (line:chararray);
一旦我使用{dump input_lines;},我就会收到错误1066,即无法为别名input_lines打开迭代器。
AboutMe是我试图读取的文件,它位于输入的hdfs目录中。我能够阅读它,我已经仔细检查了它。
Hadoop版本 hadoop-2.5.0-cdh5.3.2 ,猪版本" pig-0.12.1 "。我的Ubuntu版本是 Ubuntu 14.04.5 LTS
我的 .bashrc 文件有
export JAVA_HOME="/usr/lib/jvm/java-8-oracle"
export HADOOP_PREFIX="/home/yadav/hadoop-2.5.0-cdh5.3.2"
export PATH=$PATH:$HADOOP_PREFIX/bin
export PATH=$PATH:$HADOOP_PREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}
export HADOOP_COMMON_HOME=${HADOOP_PREFIX}
export HADOOP_HDFS_HOME=${HADOOP_PREFIX}
export YARN_HOME=${HADOOP_PREFIX}
export HIVE_HOME=/home/yadav/apache-hive-0.13.1-bin
export PATH=$PATH:$HIVE_HOME/bin
export PIG_HOME=/home/yadav/pig-0.12.1
export PATH=$PATH:$PIG_HOME/bin
export PIG_CLASSPATH="/home/yadav/hadoop-2.5.0-cdh5.3.2/conf"
我曾尝试过两种方式,即
a)从本地模式运行pig grunt shell并从本地
加载输入文件b)从hadoop模式模式运行pig grunt shell并从hdfs目录加载输入文件