Hadoop序列文件优于HDFS平面文件(文本)的优势是什么? Sequence文件以什么方式有效?
可以将小文件组合并写入序列文件,但也可以对HDFS文本文件进行相同的操作。需要知道这两种方式的区别。我一直在谷歌上搜索这个问题,如果我对此有所了解会有帮助吗?
答案 0 :(得分:25)
答案 1 :(得分:2)
Hadoop的优势Sequence files (根据Siva
网站上的hadooptutorial.info
文章)
<强>缺点:强>
答案 2 :(得分:0)
序列文件是在MapReduce处理的mapper和reducer阶段生成的中间文件。序列文件是可压缩的,处理速度快,用于在mapper和reducer reds期间写入输出。 Hadoop和Spark中有API来读/写序列文件