标签: hadoop mapreduce
我正在尝试为mapreduce开发自定义输入格式。我正在使用inputStreamReader.read()。这将逐字符地读取数据。这是否会导致性能下降。或者我可以将数据读入可配置大小的缓冲区,然后从缓冲区读取字符吗? 。哪种方法在性能方面会很好。
感谢任何帮助。