标签: apache-spark hive pyspark
想从本地磁盘读取二进制文件 并写入HVE作为关键值 - blob使用spark。 格式如下: 表XXX MyKey ---> BinaryBlob
通过查看其他答案,我发现这是为了阅读,但目前尚不清楚如何插入HIVE。
sc.binaryFiles("file:///path/to/local/file") http://www.informit.com/articles/article.aspx?p=2756471&seqNum=4