DSX读取音频文件从Watson IOT到达Bluemix对​​象存储

时间:2017-04-24 12:54:42

标签: numpy apache-spark object-storage data-science-experience

1月份,我在DSX中创建了一个链接到Bluemix对​​象存储的项目。从Watson IoT平台到达的音频文件保存在此对象存储中,它们自动加载到项目的DSX文件部分。 我不能再重新创建具有相同功能的新项目:我不能再添加数据服务,如果我配置对象存储,它将显示为目标而不是源。 我需要读取.wav文件并在Python笔记本中使用numpy处理它们。 有什么建议吗?

2 个答案:

答案 0 :(得分:0)

您可以添加更多细节吗?我不明白这是什么问题:

  • 您无法在与对象存储关联的DSX中创建新项目吗?
  • 您的wav文件是否未自动显示在DSx项目中?

答案 1 :(得分:0)

我假设您正在尝试读取您上传到对象存储的.wav文件。

对于阅读波形格式文件,您需要像scipy这样的库。

scipy库允许您从文件源中读取wav文件。

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.io.wavfile.read.html

要从对象存储中读取数据,您需要使用请求,然后您需要将内容作为文件保存到GPFS,以便您可以在scipy的读取功能中使用它。

scipy.io.wavfile.read('samplewavefile1.wav')

然后你可以使用numpy做任何你想做的事情 How to manipulate wav file data in Python?

import numpy as np import scipy.io.wavfile

rate, data = scipy.io.wavfile.read('samplewavefile1.wav')

sin_data = np.sin(data)

print sin_data

以下是完整笔记本的链接: - https://github.com/charles2588/bluemixsparknotebooks/blob/master/Python/ReadBinaryfilesfromObjectStorage.ipynb