标签: streaming hadoop amazon-emr
我正在为Amazon Elastic Map Reduce开发Hadoop流式工作流程,它涉及序列化一些二进制对象并将这些对象流式传输到Hadoop。 Hadoop是否具有流输入的最大行长度?
我开始尝试用越来越大的线来测试,但我想先在这里问一下。
答案 0 :(得分:5)
似乎没有对线路长度施加限制。自从提出问题以来,我一直在编写序列化二进制对象的代码,在base64中对它们进行编码,然后将它们放入流中进行处理。结果,一些线很长。 Hadoop一直咀嚼,没有抱怨。