我正在尝试流式传输每隔几分钟添加到我的HDFS的音频文件。关于在Spark中使用FileStream来处理文本文件的文档很多,但是对于音频文件(例如.wav格式)没有。 HDFS中流式传输文本文件的参数如下:
var n = 0x740900;
alert(((n >>> 8) & 0xFF) + 1);
//result is 10
n = 0x740a00;
alert(((n >>> 8) & 0xFF) + 1);
//result is 11
其中val linesRDD = ssc.fileStream (LongWritable, Text, TextInputFormat) (hdfs:cnesi:8085/data/test)
我想问一下.wav音频文件的这三个参数是什么,以及我需要哪些库或包来传输这些数据。
我正在使用spark 1.6.1。
感谢任何帮助和指导。