在Hadoop: how to access (many) photo images to be processed by map/reduce?次问题之后,orangeoctopus提供了合理的方向来加载图片二进制文件并将其收集到SequenceFiles
以提供映射器。
认为这也可能对其他人有用,作为本地java进程或者在大量图像文件的情况下可能是hadoop作业,我创建了这个单独的问题来寻找实现的示例。
谢谢!
答案 0 :(得分:3)
Hadoop: The Definitive Guide - 第4章有一些读/写序列文件的样本。这是同一个code。浏览代码并将其更改为二进制图像作为序列文件的输入。