我是HBase的新手。以下是我想要实现的目标: 1.如何将.pdf或.png转换为hbase可读格式? 2.如何在hbase表中导入这些文件? (将元数据存储在一个cf中,将对象存储在另一个cf中)
有人可以分享这方面的例子吗?任何其他建议都有帮助。
答案 0 :(得分:1)
对于图像,请参阅我的answer。对于PDF也会这样,因为我们试图以最原始的方式存储,即字节数组。建议您使用Serialization Utils作为pdf,如答案中的示例所述。
OR
使用返回org.apache.commons.io.FileUtils.readFileToByteArray(File file)
类型数据的Apache Commons IO byte[]
。
同时检查this