如何使用PIG处理图像文件

时间:2015-09-01 16:03:38

标签: hadoop apache-pig bigdata

有100个不同颜色的图像文件。我想根据颜色获得独特的图像

1 个答案:

答案 0 :(得分:0)

没有内置 Hadoop / Pig API 来处理图像数据。

要使用 Pig / MapReduce 处理图像数据,请使用以下步骤:

  1. 将所有图像转换为序列文件/文件

    Key             Value
    Image_file_id   Image Content

  2. 将此文件加载到 HDFS

  3. 使用任何第三方库进行检测,例如" Haar Cascades" 作为 UDF in Pig 或调用 Mapreduce中的Java库
  4. program。