版本:
Accumulo 1.5
猪0.10
尝试:
使用accumulo-pig从Pig读取/写入Accumulo中的数据
遇到错误 - 非常感谢任何有关克服错误的见解
切换到Accumulo 1.4不是一个选项,因为我们在C#代码库中使用Accumulo Thrift Proxy。
影响:
这是我们项目中的障碍。
来源参考:
源代码 - https://git-wip-us.apache.org/repos/asf/accumulo-pig.git
错误:
为了从Pig中读取Accumulo中的数据集,我收到以下错误 -
org.apache.pig.backend.executionengine.ExecException:ERROR 2118: AccumuloInputFormat的连接器信息只能为每个作业设置一次
代码段:
DATA = LOAD 'accumulo://departments?instance=indra&user=root&password=xxxxxxx&zookeepers=cdh-dn01:2181' using org.apache.accumulo.pig.AccumuloStorage() AS (row, cf, cq, cv, ts, val);
dump DATA;
答案 0 :(得分:0)
尝试使用同一存储库中的ACCUMULO-1783-1.5分支。 Pig设置InputFormat的方式与Accumulo如何设置InputFormats的方式不同(特别是,Accumulo做了一个有趣的断言,你从来没有为一个配置调用相同的静态方法)。
我一直在使用猪0.12 - 我怀疑0.10设置InputFormats而不是0.12有什么不同,但我不是正YMMV。
我刚刚修改了上面的分支,摆脱了之前提到的Hadoop版本的限制。