我想使用Hadoop处理大规模图像的分割(Pleiades图像tif格式)
我们的想法是将图像分割成图块并将它们分发到每个节点。
地图任务将是细分过程。我使用用C ++编写的OTB库开发了分割算法。
我创建了一个otb应用程序,它可以通过提供tile的路径从java程序启动,并返回分段的tile。
我真的不知道如何实现分割机制,我必须自定义fileInputFormat类和RecorReader类,但具有什么类型的输入键和输入值。
实际上我必须让瓷砖的路径分段......
如果有人有建议吗?
最诚挚的问候,
答案 0 :(得分:0)
解决方案策略可能取决于图像的数量和尺寸的多样性。 如果您有很多图像(比集群中的免费映射器插槽数量多得多),您可能会考虑使用StreamInputFormat处理mapper中的每个图像并使用您的分割算法。否则,您可能需要实现自己的InputFormat,这将形成正确的InputSplits。