标签: hadoop apache-pig ebcdic
我正在尝试使用PIG(hadoop)读取ebcdic IBM文件,因此我需要创建自定义加载函数。
dafault getInputFormat()如下:
@Override public InputFormat getInputFormat() { return new TextInputFormat(); }
我想我需要编写自己的InputFormat来读取ebcdic文件,对吗? 如果是,我该怎么做?