标签: scala apache-spark
我有一个有几个记录的HDFS文件。
我希望能够写出每条记录的大小,然后记录记录本身。
如何执行上述操作,然后saveAsSequenceFile?
saveAsSequenceFile
注意:记录采用byteArray格式