读取二进制文件并使用spark存储到配置单元中

时间:2018-01-24 13:23:42

标签: apache-spark hive pyspark

想从本地磁盘读取二进制文件 并写入HVE作为关键值 - blob使用spark。 格式如下:    表XXX       MyKey ---> BinaryBlob

通过查看其他答案,我发现这是为了阅读,但目前尚不清楚如何插入HIVE。

sc.binaryFiles("file:///path/to/local/file") 


http://www.informit.com/articles/article.aspx?p=2756471&seqNum=4

0 个答案:

没有答案