tf.audio.decode_wav如何获取其内容?

时间:2019-09-25 10:15:21

标签: python tensorflow

我正在尝试使用tf.audio.decode_wav将一些音频文件拉入Tensorflow。

我可以看到有人正在寻找在文档中提供更多信息的方法,但是没有人有任何示例说明该如何工作吗?

tf.audio.decode_wav(
 contents,
 desired_channels=-1,
 desired_samples=-1,
 name=None
)

Args:

  • contents:类型为字符串的张量。 WAV编码的音频,通常来自文件。
  • desired_channels:可选的int。默认为-1。所需的样本通道数。
  • desired_samples:一个可选的int。默认为-1。请求的音频长度。
  • 名称:操作的名称(可选)。

我猜测内容是已经从文件而非路径中拉出的张量?

1 个答案:

答案 0 :(得分:5)

您是对的,tf.audio.decode_wav()需要张量。您可以提供一个 tf.io.read_file()会将wav文件读取为字符串类型的张量。

raw_audio = tf.io.read_file(filename)
waveform = tf.audio.decode_wav(raw_audio)