标签: hadoop hive sqoop
我们在hive中有Oracle BLOB和VARBINARY(SQL Server / Progress)数据,它们存储为String或Binary数据类型。我们使用sqoop从各自的RDBMS中提取数据。既然我们在hdfs中有数据,我们希望看到实际的附件,如pdf,图像,doc等。我们如何将hive二进制格式数据反序列化为相应的文件?
简而言之,我们需要将hive中的二进制数据转换为相应的附件(pdf,jpg,doc),假设我们知道文件类型。