如何将pdf / images存储到HBase表

时间:2017-03-09 07:02:47

标签: java hadoop pdf hbase blob

我是HBase的新手。以下是我想要实现的目标: 1.如何将.pdf或.png转换为hbase可读格式? 2.如何在hbase表中导入这些文件? (将元数据存储在一个cf中,将对象存储在另一个cf中)

有人可以分享这方面的例子吗?任何其他建议都有帮助。

1 个答案:

答案 0 :(得分:1)

对于图像,请参阅我的answer。对于PDF也会这样,因为我们试图以最原始的方式存储,即字节数组。建议您使用Serialization Utils作为pdf,如答案中的示例所述。

OR

使用返回org.apache.commons.io.FileUtils.readFileToByteArray(File file)类型数据的Apache Commons IO byte[]

同时检查this